Autoresearch - Andrej Karpathy julkaisi juuri autonomiset tekoälyagentit, jotka tekevät tutkimusta yhdessä yössä - mitä se tarkoittaa yritysten tekoälylle?

- Reagointi - AI Trends - 6 min lukea


Mitä tapahtui

Osoitteessa , Andrej Karpathy - Teslan entinen tekoälyjohtaja ja OpenAI:n toinen perustaja - julkaisi autoresearch GitHubissa, avoimen lähdekoodin kehys, jonka avulla tekoälyagentit voivat itsenäisesti suorittaa koneoppimiskokeita yhdessä yössä yhdellä GPU:lla. Ydinajatus: anna agentille harjoitusasetukset, mene nukkumaan ja herää 100 suoritettuun kokeeseen - jokainen muokkaa koodia, harjoittelee viisi minuuttia, tarkistaa, paraniiko tulos, ja iteroi. Ei ihmistä silmukassa. Agentti ei pysähdy ennen kuin keskeytät sen manuaalisesti. Repo ylitti 8000 tähteä muutamassa päivässä julkaisun jälkeen.


Mitä tämä oikeastaan tarkoittaa - Hypen lisäksi

Puhutaanpa tarkkaan siitä, mitä automaattinen haku on ja mitä se ei ole. Se ei ole yleiskäyttöinen tekoäly, joka korvaa datatieteilijät. Se on tiukasti rajattu silmukka: yksi agentti, yksi tiedosto, jota se voi muokata (train.py), yksi kiinteä 5 minuutin arviointi-ikkuna, yksi optimoitava mittari. Merkittävää ei ole sen laajuus vaan se, että se on arkkitehtuuripäätös sen takana: täysin autonominen agentti, joka suorittaa kokeen, lukee tuloksen, päättää, mitä kokeilla seuraavaksi, ja toistaa sen - koodissa on nimenomainen ohje, jonka mukaan älä koskaan pysähdy äläkä koskaan pyydä ihmiseltä lupaa jatkaa.

Tämä suunnittelufilosofia - itsenäinen, itseohjautuva, mittareihin perustuva iterointi - on malli, jota kohti yritysten tekoäly on nopeasti siirtymässä. Ei vain ML-tutkimuksessa, vaan kaikilla aloilla, joilla on selkeä tavoite, mitattavissa oleva tuotos ja riittävän suuri hakuavaruus, jolloin ihmisen tahdittama iterointi on pullonkaula. Tämä kuvaa merkittävää osaa siitä, mitä yritysten BI- ja analytiikkatiimit tekevät päivittäin.


Kolme konkreettista seurausta yritystiimeille

1. "Agenttisuus" ei ole enää tutkimuskäsite - se on tuotantomalli. Karpathyn panos ei ole tekoälyagenttien idea, vaan sen osoittaminen, että puhtaalla, minimaalisella, yhden tiedoston sisältävällä toteutuksella voidaan suorittaa 100 mielekästä koetta yhdessä yössä tavallisella laitteistolla. Autonomisten tekoälysilmukoiden käyttöönoton esteet yrityskonteksteissa - raportoinnin automatisointi, dataputkien optimointi, asiakirjojen käsittely - ovat juuri laskeneet merkittävästi. Tiimien, jotka ovat odottaneet, että tämä "kypsyy", pitäisi tarkistaa aikataulunsa.

2. Ihmisen rooli siirtyy tekemisestä tarkasteluun. Automaattinen tutkimussilmukka ei pyydä hyväksyntää kokeiden välillä. Se luo, testaa, säilyttää sen, mikä toimii, hylkää sen, mikä ei toimi, ja siirtyy eteenpäin. Yritysten näkökulmasta tämä vastaa suoraan tekoälyjärjestelmiä, jotka laativat raportteja, suorittavat skenaarioanalyysejä tai käsittelevät saapuvia pyyntöjä itsenäisesti - ja tuovat esiin vain ne tulokset, jotka vaativat ihmisen arviointia. Tämä ei ole uhka ammattitaitoisille analyytikoille, vaan heidän aikansa on jaettava uudelleen. Vähemmän tuottamista, enemmän arviointia.

3. Tietojen laadusta ja selkeistä menestysmittareista tulee ehdottomia. Automaattinen haku toimii, koska sillä on yksiselitteinen metriikka: validointi bittiä per tavu. Pienempi on parempi. Jokainen koe on objektiivisesti vertailukelpoinen. Yritysympäristössä vastaava kysymys on: mikä on organisaatiosi "val_bpb"? Jos automatisoidulle työnkululle ei voida määritellä yhtä mitattavaa menestyskriteeriä, autonomiset agentit eivät voi optimoida sitä kohti. Eniten agenttitekoälystä hyötyvät ne hankkeet, joissa on jo tehty työtä sen määrittelemiseksi, mitä "parempi" tarkoittaa konkreettisesti ja mitattavissa olevin termein.


LeapLyticsin näkökulma

Olemme rakentaneet tekoälyjärjestelmiä yritysten työnkulkuihin jo useiden vuosien ajan - asiakirjojen käsittely, automatisoitu raportointi, tuen automatisointi. Karpathyn ML-tutkimuskerroksessa käyttämä malli on sama, jota sovellamme liiketoimintaprosessikerroksessa: tunnista toistuva silmukka, määrittele onnistumiskriteeri, anna agentin toimia ja tuo poikkeukset ihmisen tarkasteltavaksi.

Automaattitutkimus tekee sisäisesti selväksi sen, että nopeusero. 100 koetta 8 tunnissa. Yrityksen kannalta: 100 asiakirjaluonnosta tarkistetaan, 100 datapoikkeamaa merkitään, 100 tukipyyntöä luokitellaan - samalla kun tiimisi nukkuu. Organisaatiot, jotka pitävät tätä kuriositeettina, huomaavat, että ne, jotka pitävät sitä infrastruktuurina, ovat edenneet merkittävästi eteenpäin, kun he harkitsevat asiaa uudelleen. Olemme kirjoittaneet tästä dynamiikasta aiemmin seuraavissa yhteyksissä. oma siirtymämme tekoälyavusteiseen tukeen - automaation yhdistelmäetu ei näy, ennen kuin se näkyy.


Mitä organisaatioiden pitäisi tehdä nyt

  • Määritä yksi toistuva, mitattavissa oleva työnkulku tällä viikolla. Ei epämääräistä "meidän pitäisi automatisoida raportointi". Konkreettinen silmukka: tämäntyyppinen asiakirja, jota käsitellään tällä tavalla, arvioidaan tämän kriteerin perusteella. Automaattitutkimus on hyödyllinen mentaalimalli - jos et pysty kuvaamaan työnkulkuasi siten kuin Karpathy kuvaa koulutussilmukkaa, se ei ole vielä valmis agenttien automatisointiin.
  • Investoi tietojen laatuun ennen agentin käyttöönottoa. Autonomiset agentit vahvistavat sitä, minkä kanssa ne työskentelevät. Puhtaat, johdonmukaisesti jäsennellyt syöttötiedot tuottavat hyödyllisiä autonomisia tuotoksia. Sotkuiset, epäjohdonmukaiset tiedot tuottavat varmuudella virheellisiä autonomisia tuotoksia - 100 kertaa nopeammin kuin ihminen, joka tekee saman virheen. Tiedonhallinta on nyt tekoälyvalmiuskysymys, ei vain taloudenhoitokysymys.
  • Muotoile "tekoälystrategia" seuraavasti: "Mitkä silmukat automatisoidaan ensin". Useimmat yritysten tekoälystrategiat on edelleen organisoitu työkalujen ja toimittajien ympärille. Autotutkimuksen jälkeinen hyödyllisempi kehys on: mikä työnkuluistamme on silmukka, jolla on mitattavissa oleva tuotos? Aseta ne järjestykseen volyymin ja vaikutuksen mukaan. Aloita suurimman volyymin ja selkeimmin mitattavasta silmukasta. Se on ensimmäinen agenttisi käyttöönotto.

Mitä seuraavaksi

Automaattinen haku on tarkoituksella minimaalinen - yksi GPU, yksi tiedosto, yksi mittari. Välittömänä seuraavana askeleena, joka on jo nähtävissä reposta nousevissa yhteisön haaroissa, ovat moniagenttiset vaihtoehdot: yksi agentti luo hypoteeseja, toinen suorittaa kokeita, kolmas arvioi ja syntetisoi tuloksia. Yrityskielessä tämä vastaa täydellistä työnkulun automatisointia: vastaanotto, käsittely, laadun tarkistus ja tulosten reititys hoidetaan koordinoidun agenttiketjun avulla, ja ihmisen on tarkistettava tulokset vain määritellyissä poikkeustapauksissa.

Tärkeämpi muutos on kulttuurinen. Karpathyn muotoilu, jonka mukaan tekoälyn eturintamassa tehtävää tutkimusta "tekivät ennen lihatietokoneet syömisen, nukkumisen ja muun hauskanpidon välissä", on tarkoituksella provosoiva. Perimmäinen pointti on kuitenkin vakava: tekoälyyn liittyvässä työssä kilpailuetu on siirtymässä ihmisen suorittamisnopeudesta suunnittelemienne silmukoiden laatuun ja optimoimienne mittareiden selkeyteen. Tämä on totta ML-tutkimuksessa. Se pätee yhtä lailla yritysanalytiikassa, riskiraportoinnissa ja dokumentti-intensiivisissä työnkuluissa. Kysymys ei ole enää siitä, pitäisikö näitä silmukoita rakentaa. Vaan kuinka nopeasti.

Saatat myös pitää...

Suosittuja viestejä

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *