- Reakcija - AI tendencijos - 6 min. perskaityti
Kas nutiko
Svetainėje , Andrejus Karpathy - buvęs "Tesla" dirbtinio intelekto direktorius ir vienas iš "OpenAI" įkūrėjų - paskelbė autoresearch on GitHub, atvirojo kodo sistema, kuri leidžia dirbtinio intelekto agentams savarankiškai atlikti mašininio mokymosi eksperimentus per naktį viename GPU. Pagrindinė idėja: duokite agentui mokymo sąranką, eikite miegoti ir pabuskite, kad pamatytumėte 100 atliktų eksperimentų - kiekvieną iš jų pakeiskite kodą, penkias minutes mokykite, patikrinkite, ar rezultatas pagerėjo, ir kartokite. Žmogaus cikle nėra. Agentas niekada nesustoja, kol jo nenutraukiate rankiniu būdu. Per kelias dienas nuo išleidimo repo viršijo 8 000 žvaigždučių.
Ką tai iš tikrųjų reiškia - ne tik triukšmas
Tiksliai paaiškinkime, kas yra ir kas nėra automatinė paieška. Tai nėra bendrosios paskirties dirbtinis intelektas, kuris pakeičia duomenų specialistus. Tai griežtai apibrėžtas ciklas: vienas agentas, vienas failas, kurį jis gali keisti (train.py), vienas fiksuotas 5 minučių vertinimo langas, viena optimizuojama metrika. Reikšminga ne apimtis, o tai, kad sprendimas dėl architektūros už jo: visiškai autonomiškas agentas, kuris atlieka eksperimentą, perskaito rezultatus, nusprendžia, ką bandyti toliau, ir pakartoja - su aiškiu nurodymu kode niekada nesustoti ir neprašyti žmogaus leidimo tęsti.
Tokia projektavimo filosofija - autonomiškas, savarankiškas, metrika paremtas kartojimas - yra šablonas, prie kurio sparčiai artėja įmonių dirbtinis intelektas. Ne tik ML tyrimuose, bet ir bet kurioje kitoje srityje, kurioje yra aiškus tikslas, išmatuojamas rezultatas ir pakankamai didelė paieškos erdvė, kurioje žmogaus atliekama iteracija yra kliūtis. Tai apibūdina didelę dalį to, ką kasdien daro įmonių BI ir analitikos komandos.
Trys konkrečios pasekmės įmonių komandoms
1. "Agentinis" nebėra mokslinių tyrimų sąvoka - tai gamybos modelis. Karpathy indėlis šiuo atveju nėra dirbtinio intelekto agentų idėja; jis parodė, kad švarus, minimalus, vieno failo įgyvendinimas gali atlikti 100 reikšmingų eksperimentų per naktį naudojant paprastą aparatinę įrangą. Autonominių dirbtinio intelekto ciklų diegimo barjeras įmonių kontekste - ataskaitų automatizavimas, duomenų vamzdynų optimizavimas, dokumentų apdorojimas - ką tik gerokai sumažėjo. Komandos, kurios laukė, kol tai "subręs", turėtų persvarstyti savo terminus.
2. Žmogaus vaidmuo keičiasi - nuo veiklos pereinama prie peržiūros. Automatinio tyrimo ciklas neprašo patvirtinimo tarp eksperimentų. Ji generuoja, testuoja, išsaugo tai, kas veikia, atmeta tai, kas neveikia, ir eina toliau. Kalbant apie įmones, tai tiesiogiai siejama su dirbtinio intelekto sistemomis, kurios savarankiškai rengia ataskaitas, atlieka scenarijų analizę arba apdoroja gautas užklausas ir pateikia tik tuos rezultatus, kuriuos turi įvertinti žmogus. Tai nėra grėsmė kvalifikuotiems analitikams; tai yra jų laiko perskirstymas. Mažiau generavimo, daugiau vertinimo.
3. Duomenų kokybė ir aiškūs sėkmės rodikliai tampa neginčytinais dalykais. Automatinė paieška veikia, nes turi vienareikšmišką metriką: patvirtinimo bitų vienam baitui. Mažesnė vertė yra geresnė. Kiekvienas eksperimentas yra objektyviai palyginamas. Įmonių aplinkoje lygiavertis klausimas yra toks: koks yra jūsų organizacijos "val_bpb"? Jei negalite apibrėžti vienintelio, išmatuojamo automatizuoto darbo eigos sėkmės kriterijaus, autonominiai agentai negali optimizuotis jo siekdami. Didžiausią naudą iš agentinio dirbtinio intelekto gaus tie projektai, kurie jau atliko darbą apibrėždami, ką reiškia "geriau" konkrečiais, išmatuojamais terminais.
"LeapLytics" perspektyva
Jau kelerius metus kuriame dirbtinio intelekto sistemas, skirtas įmonių darbo eigai. dokumentų tvarkymas, automatinis ataskaitų rengimas, paramos automatizavimas. Karpathy demonstruoja ML tyrimų lygmens modelį, kurį mes taikome verslo procesų lygmenyje: nustatome pasikartojantį ciklą, apibrėžiame sėkmės kriterijų, leidžiame agentui veikti ir išryškiname išimtis, kad jas peržiūrėtų žmogus.
Automatiniai tyrimai aiškiai parodo, kad greičio skirtumas. 100 eksperimentų per 8 valandas. Kalbant įmonių terminais: 100 peržiūrėtų dokumentų projektų, 100 duomenų anomalijų, 100 techninės pagalbos bilietų kategorijų - kol jūsų komanda miega. Organizacijos, kurios tai traktuoja kaip įdomybę, pastebės, kad tos, kurios tai traktuoja kaip infrastruktūrą, iki to laiko, kai persigalvos, jau bus gerokai pažengusios į priekį. Apie šią dinamiką jau rašėme anksčiau, kalbėdami apie mūsų pačių perėjimas prie dirbtinio intelekto palaikymo - automatizavimo pranašumas nėra matomas tol, kol jis nėra pastebimas.
Ką organizacijos turėtų daryti dabar
- Šią savaitę nustatykite vieną pasikartojantį, išmatuojamą darbo procesą. Ne miglotas "turėtume automatizuoti ataskaitų teikimą". Konkretus ciklas: šio tipo dokumentas, apdorotas šiuo būdu, įvertintas pagal šį kriterijų. Automatinė paieška yra naudingas mentalinis modelis - jei negalite aprašyti savo darbo eigos taip, kaip Karpathy aprašo savo mokymo kilpą, ji dar nepasirengusi agentų automatizavimui.
- Prieš diegdami agentą investuokite į duomenų kokybę. Autonominiai agentai sustiprina viską, su kuo jie dirba. Švarūs, nuosekliai struktūruoti įvesties duomenys sukuria naudingą autonominę išvestį. Netvarkingi, nenuoseklūs duomenys sukuria užtikrintai klaidingą autonominę išvestį - 100 kartų greičiau nei žmogus, padaręs tą pačią klaidą. Duomenų valdymas dabar yra ne tik tvarkymosi, bet ir pasirengimo dirbtiniam intelektui klausimas.
- "AI strategiją" pertvarkykite taip: "Kurias kilpas automatizuosime pirmiausia". Dauguma įmonių dirbtinio intelekto strategijų vis dar grindžiamos įrankiais ir pardavėjais. Naudingesnė sistema po automatinių tyrimų yra tokia: kurios mūsų darbo eigos yra ciklas su išmatuojamais rezultatais? Išrikiuokite juos pagal apimtį ir poveikį. Pradėkite nuo didžiausios apimties, aiškiausiai išmatuojamos kilpos. Tai yra jūsų pirmasis agento diegimas.
Kas toliau
Automatinė paieška sąmoningai yra minimali - vienas GPU, vienas failas, viena metrika. Artimiausias kitas žingsnis, kuris jau matomas bendruomenės šakutėse, atsirandančiose iš duomenų saugyklos, yra kelių agentų variantai: vienas agentas generuoja hipotezes, kitas atlieka eksperimentus, trečias vertina ir apibendrina rezultatus. Įmonių požiūriu tai reiškia visišką darbo eigos automatizavimą: priėmimas, apdorojimas, kokybės tikrinimas ir išvesties nukreipimas koordinuota agentų grandine, o žmogus tikrina tik nustatytais išimtiniais atvejais.
Svarbesnis pokytis yra kultūrinis. Karpathy įrėminimas, kad pasienio dirbtinio intelekto tyrimus "anksčiau atlikdavo mėsos kompiuteriai tarp valgymo, miego, kitų pramogų", yra sąmoningai provokuojantis. Tačiau pagrindinė mintis yra rimta: konkurencinis pranašumas dirbant su dirbtiniu intelektu susijusį darbą keičiasi nuo žmogiškojo vykdymo spartos prie jūsų kuriamų ciklų kokybės ir rodiklių, kuriuos optimizuojate, aiškumo. Taip yra ir ML tyrimuose. Lygiai taip pat tai pasakytina ir apie įmonių analitiką, rizikos ataskaitų rengimą ir daug dokumentų reikalaujančias darbo eigas. Klausimas nebėra, ar kurti šias kilpas. Svarbiausia - kaip greitai.