Avtomatske raziskave - Andrej Karpathy je pravkar izdal avtonomne agente umetne inteligence, ki čez noč izvajajo raziskave - kaj to pomeni za umetno inteligenco v podjetjih

- Reakcija - Trendi umetne inteligence - 6 min branja


Kaj se je zgodilo

Na spletni strani , Andrej Karpathy - nekdanji direktor Tesle za umetno inteligenco in soustanovitelj OpenAI - je objavil autoresearch na GitHubu, odprtokodno ogrodje, ki agentom umetne inteligence omogoča avtonomno izvajanje poskusov strojnega učenja čez noč na enem samem grafičnem procesorju. Osnovna zamisel: agentu dajte nastavitev za učenje, zaspite in se zbudite s 100 dokončanimi poskusi - pri vsakem spremenite kodo, pet minut učite, preverite, ali se je rezultat izboljšal, in ponovite. Človeka v zanki ni. Agent se nikoli ne ustavi, dokler ga ročno ne prekinete. Repo je v nekaj dneh po objavi presegel 8000 zvezdic.


Kaj to dejansko pomeni - kaj je več od razburjenja

Natančno povejmo, kaj je in kaj ni samodejno iskanje. To ni splošna umetna inteligenca, ki bi nadomestila podatkovne strokovnjake. Gre za tesno omejeno zanko: en agent, ena datoteka, ki jo lahko spreminja (train.py), eno fiksno 5-minutno ocenjevalno okno, ena metrika za optimizacijo. Pomemben ni obseg, temveč odločitev o arhitekturi v ozadju: popolnoma avtonomni agent, ki izvede poskus, prebere rezultate, se odloči, kaj bo poskusil naprej, in ponovi - z izrecnim navodilom v kodi, da nikoli se ne ustavite in ne vprašajte človeka za dovoljenje za nadaljevanje.

Ta filozofija zasnove - avtonomno, samousmerjeno in z metrikami podprto ponavljanje - je vzorec, h kateremu se umetna inteligenca v podjetjih hitro približuje. Ne le v raziskavah ML, temveč na vseh področjih, kjer je jasen cilj, merljiv rezultat in dovolj velik iskalni prostor, da je iteracija, ki jo izvaja človek, ozko grlo. To opisuje velik del tega, kar vsak dan počnejo ekipe za BI in analitiko v podjetjih.


Tri konkretne posledice za ekipe v podjetjih

1. "Agentic" ni več raziskovalni koncept - je proizvodni vzorec. Karpathyjev prispevek pri tem ni zamisel o agentih umetne inteligence, temveč dokaz, da lahko čista, minimalna izvedba z eno datoteko čez noč izvede 100 smiselnih poskusov na strojni opremi. Ovire za uvajanje avtonomnih zank umetne inteligence v podjetjih - avtomatizacija poročanja, optimizacija podatkovnih cevovodov, obdelava dokumentov - so se pravkar bistveno zmanjšale. Ekipe, ki so čakale, da bo to "dozorelo", bi morale ponovno uskladiti svoje časovne načrte.

2. Vloga človeka se spremeni z opravljanja na pregledovanje. Samoraziskovalna zanka med poskusi ne zahteva odobritve. Ustvari, preizkusi, ohrani, kar deluje, zavrže, kar ne, in gre naprej. V podjetjih se to neposredno nanaša na sisteme umetne inteligence, ki samostojno pripravljajo poročila, izvajajo analize scenarijev ali obdelujejo prejete zahteve - in na površje prikažejo le rezultate, za katere je potrebna človeška presoja. To ni grožnja usposobljenim analitikom, temveč prerazporeditev njihovega časa. Manj ustvarjanja, več ocenjevanja.

3. Kakovost podatkov in jasne metrike uspeha postanejo nepogrešljivi. Samodejno iskanje deluje, ker ima nedvoumno metriko: potrjevanje bitov na bajt. Manjši je boljši. Vsak poskus je objektivno primerljiv. V podjetjih se enakovredno vprašanje glasi: kakšen je "val_bpb" vaše organizacije? Če ne morete opredeliti enega samega, merljivega merila uspešnosti za avtomatiziran potek dela, se avtonomni agenti ne morejo optimizirati za doseganje tega merila. Projekti, ki bodo imeli največ koristi od agentske umetne inteligence, so tisti, ki so se že lotili opredelitve, kaj pomeni "bolje" v konkretnih, merljivih izrazih.


Perspektiva družbe LeapLytics

Že več let gradimo sisteme umetne inteligence za delovne tokove v podjetjih - obdelava dokumentov, avtomatizirano poročanje, avtomatizacija podpore. Vzorec, ki ga Karpathy prikazuje na ravni ML raziskav, je enak vzorcu, ki ga uporabljamo na ravni poslovnih procesov: prepoznajte ponavljajočo se zanko, določite merilo uspeha, pustite agenta delovati in izpostavite izjeme za človeški pregled.

Avtoraziskava jasno pokaže, da je razlika v hitrosti. 100 poskusov v 8 urah. V podjetniškem smislu: 100 pregledanih osnutkov dokumentov, 100 označenih podatkovnih anomalij, 100 kategoriziranih obvestil za podporo - medtem ko vaša ekipa spi. Organizacije, ki to obravnavajo kot zanimivost, bodo ugotovile, da so organizacije, ki to obravnavajo kot infrastrukturo, do ponovnega premisleka že znatno napredovale. O tej dinamiki smo že pisali v okviru naš lastni prehod na podporo s pomočjo umetne inteligence. - povečana prednost avtomatizacije ni vidna, dokler ni vidna.


Kaj morajo organizacije storiti zdaj

  • Ta teden določite en ponavljajoč se, merljiv delovni proces. Ne pa nejasno "morali bi avtomatizirati poročanje". Konkretna zanka: ta vrsta dokumenta, obdelana na ta način, ocenjena na podlagi tega merila. Samodejno poročanje je uporaben miselni model - če svojega delovnega procesa ne morete opisati tako, kot Karpathy opisuje svojo zanko za usposabljanje, ta še ni pripravljen za avtomatizacijo agentov.
  • Pred uvedbo agenta vlagajte v kakovost podatkov. Avtonomni agenti okrepijo vse, s čimer delajo. Čisti, dosledno strukturirani vhodni podatki dajejo uporabne avtonomne rezultate. Neurejeni, nekonsistentni podatki ustvarjajo zanesljivo napačne avtonomne rezultate - s 100-krat večjo hitrostjo kot človek, ki naredi enako napako. Upravljanje podatkov je zdaj vprašanje pripravljenosti na umetno inteligenco in ne le vprašanje vzdrževanja.
  • "Strategijo umetne inteligence" spremenite v "katere zanke bomo najprej avtomatizirali". Večina strategij umetne inteligence v podjetjih se še vedno osredotoča na orodja in prodajalce. Koristnejši okvir po avtokampanju je: kateri od naših delovnih postopkov je zanka z merljivim rezultatom? Razvrstite jih po obsegu in vplivu. Začnite z zanko z največjim obsegom in najbolj jasnim merljivim učinkom. To je vaša prva uvedba agenta.

Kaj sledi

Samodejno iskanje je namerno minimalno - en grafični procesor, ena datoteka, ena metrika. Takojšnji naslednji korak, ki je že viden v vilicah skupnosti, ki izhajajo iz repozitorija, so različice z več agenti: en agent ustvarja hipoteze, drugi izvaja poskuse, tretji vrednoti in sintetizira rezultate. V podjetniškem smislu to pomeni popolno avtomatizacijo delovnega procesa: sprejem, obdelavo, preverjanje kakovosti in usmerjanje rezultatov, ki jih izvaja usklajena veriga agentov s človeškim pregledom le na določenih točkah izjem.

Pomembnejši je kulturni premik. Karpathyjeva formulacija, da so pionirske raziskave umetne inteligence "včasih opravljali računalniki z mesom med prehranjevanjem, spanjem in drugimi zabavami", je namerno provokativna. Vendar je bistvo resno: konkurenčna prednost pri delu, povezanem z umetno inteligenco, se premika od hitrosti človeške izvedbe h kakovosti načrtovanih zank in jasnosti metrik, ki jih optimizirate. To velja tudi za raziskave na področju ML. Enako velja za analitiko v podjetjih, poročanje o tveganjih in delovne tokove, ki zahtevajo veliko dokumentov. Vprašanje ni več, ali naj te zanke oblikujemo. Gre za to, kako hitro.

Morda vam bo všeč tudi...

Priljubljene objave

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja