Autoresearch - Ο Andrej Karpathy μόλις κυκλοφόρησε αυτόνομους πράκτορες AI που εκτελούν έρευνα σε μια νύχτα - Να τι σημαίνει αυτό για το Enterprise AI

- Αντίδραση - AI Trends - 6 min διαβάσει


Τι συνέβη

Στο , ο Andrej Karpathy - πρώην διευθυντής Τεχνητής Νοημοσύνης της Tesla και συνιδρυτής του OpenAI - δημοσίευσε autoresearch στο GitHub, ένα πλαίσιο ανοικτού κώδικα που επιτρέπει σε πράκτορες τεχνητής νοημοσύνης να εκτελούν αυτόνομα πειράματα μηχανικής μάθησης σε μία μόνο GPU. Η βασική ιδέα: δώστε στον πράκτορα μια ρύθμιση εκπαίδευσης, πέστε για ύπνο και ξυπνήστε με 100 ολοκληρωμένα πειράματα - το καθένα τροποποιεί τον κώδικα, εκπαιδεύει για πέντε λεπτά, ελέγχει αν το αποτέλεσμα βελτιώθηκε και επαναλαμβάνει. Χωρίς άνθρωπο στο βρόχο. Ο πράκτορας δεν σταματά ποτέ μέχρι να τον διακόψετε χειροκίνητα. Το repo ξεπέρασε τα 8.000 αστέρια μέσα σε λίγες ημέρες από την κυκλοφορία του.


Τι σημαίνει αυτό στην πραγματικότητα - Πέρα από τη διαφημιστική εκστρατεία

Ας είμαστε ακριβείς σχετικά με το τι είναι και τι δεν είναι η αυτόματη έρευνα. Δεν είναι μια τεχνητή νοημοσύνη γενικής χρήσης που αντικαθιστά τους επιστήμονες δεδομένων. Είναι ένας βρόχος με στενή εμβέλεια: ένας πράκτορας, ένα αρχείο που μπορεί να τροποποιήσει (train.py), ένα σταθερό παράθυρο αξιολόγησης διάρκειας 5 λεπτών, μια μετρική προς βελτιστοποίηση. Αυτό που το καθιστά σημαντικό δεν είναι το πεδίο εφαρμογής - είναι το απόφαση αρχιτεκτονικής πίσω από αυτό: ένας πλήρως αυτόνομος πράκτορας που εκτελεί ένα πείραμα, διαβάζει το αποτέλεσμα, αποφασίζει τι θα δοκιμάσει στη συνέχεια και επαναλαμβάνει - με ρητή εντολή στον κώδικα να ποτέ δεν σταματάτε και ποτέ δεν ζητάτε από τον άνθρωπο την άδεια να συνεχίσετε.

Αυτή η φιλοσοφία σχεδιασμού - αυτόνομη, αυτοκατευθυνόμενη, μετρούμενη επανάληψη - είναι το πρότυπο προς το οποίο κινείται με ταχείς ρυθμούς η επιχειρησιακή τεχνητή νοημοσύνη. Όχι μόνο στην έρευνα ML, αλλά σε κάθε τομέα όπου υπάρχει ένας σαφής στόχος, μετρήσιμο αποτέλεσμα και ένας αρκετά μεγάλος χώρος αναζήτησης, ώστε η επανάληψη με ανθρώπινο ρυθμό να αποτελεί το σημείο συμφόρησης. Κάτι που περιγράφει ένα σημαντικό μέρος όσων κάνουν καθημερινά οι ομάδες BI και analytics των επιχειρήσεων.


Τρεις συγκεκριμένες επιπτώσεις για τις επιχειρηματικές ομάδες

1. Το "Agentic" δεν είναι πλέον μια ερευνητική έννοια - είναι ένα πρότυπο παραγωγής. Η συνεισφορά του Karpathy εδώ δεν είναι η ιδέα των πρακτόρων ΤΝ- είναι ότι δείχνει ότι μια καθαρή, ελάχιστη, μονή εφαρμογή ενός αρχείου μπορεί να εκτελέσει 100 σημαντικά πειράματα μέσα σε μια νύχτα σε βασικό υλικό. Το εμπόδιο για την ανάπτυξη αυτόνομων βρόχων τεχνητής νοημοσύνης σε επιχειρηματικά πλαίσια - αυτοματοποίηση αναφορών, βελτιστοποίηση αγωγών δεδομένων, επεξεργασία εγγράφων - μόλις μειώθηκε σημαντικά. Οι ομάδες που περίμεναν να "ωριμάσει" αυτό το θέμα θα πρέπει να αναπροσαρμόσουν τα χρονοδιαγράμματά τους.

2. Ο ανθρώπινος ρόλος μετατοπίζεται από την εκτέλεση στην αναθεώρηση. Ο βρόχος αυτόματης έρευνας δεν ζητά έγκριση μεταξύ των πειραμάτων. Δημιουργεί, δοκιμάζει, κρατάει ό,τι λειτουργεί, απορρίπτει ό,τι δεν λειτουργεί και προχωράει. Σε όρους επιχείρησης, αυτό αντιστοιχεί άμεσα σε συστήματα τεχνητής νοημοσύνης που συντάσσουν εκθέσεις, εκτελούν αναλύσεις σεναρίων ή επεξεργάζονται αυτόνομα τα εισερχόμενα αιτήματα - και φέρνουν στην επιφάνεια μόνο τα αποτελέσματα που χρειάζονται ανθρώπινη κρίση. Αυτό δεν αποτελεί απειλή για τους ειδικευμένους αναλυτές, αλλά ανακατανομή του χρόνου τους. Λιγότερη παραγωγή, περισσότερη αξιολόγηση.

3. Η ποιότητα των δεδομένων και οι σαφείς μετρήσεις επιτυχίας καθίστανται αδιαπραγμάτευτες. Η αυτόματη αναζήτηση λειτουργεί επειδή έχει μια σαφή μετρική: επικύρωση bits-per-byte. Το χαμηλότερο είναι καλύτερο. Κάθε πείραμα είναι αντικειμενικά συγκρίσιμο. Σε επιχειρησιακές ρυθμίσεις, το αντίστοιχο ερώτημα είναι: ποιο είναι το "val_bpb" του οργανισμού σας; Εάν δεν μπορείτε να ορίσετε ένα ενιαίο, μετρήσιμο κριτήριο επιτυχίας για μια αυτοματοποιημένη ροή εργασιών, οι αυτόνομοι πράκτορες δεν μπορούν να βελτιστοποιήσουν την πορεία τους προς αυτό. Τα έργα που θα επωφεληθούν περισσότερο από την agentic AI είναι αυτά που έχουν ήδη κάνει τη δουλειά του να ορίσουν τι σημαίνει "καλύτερα" με συγκεκριμένους, μετρήσιμους όρους.


Η προοπτική της LeapLytics

Χτίζουμε συστήματα τεχνητής νοημοσύνης για επιχειρησιακές ροές εργασίας εδώ και αρκετά χρόνια - επεξεργασία εγγράφων, αυτοματοποιημένη αναφορά, αυτοματοποίηση υποστήριξης. Το μοτίβο που επιδεικνύει ο Karpathy στο επίπεδο έρευνας ML είναι το ίδιο μοτίβο που εφαρμόζουμε στο επίπεδο επιχειρησιακής διαδικασίας: προσδιορίστε τον επαναλαμβανόμενο βρόχο, ορίστε το κριτήριο επιτυχίας, αφήστε τον πράκτορα να τρέξει και φέρτε στην επιφάνεια τις εξαιρέσεις για ανθρώπινη εξέταση.

Αυτό που η αυτόματη έρευνα καθιστά σπλαχνικά σαφές είναι η διαφορά ταχύτητας. 100 πειράματα σε 8 ώρες. Σε όρους επιχείρησης: 100 προσχέδια εγγράφων που εξετάστηκαν, 100 ανωμαλίες δεδομένων που επισημάνθηκαν, 100 εισιτήρια υποστήριξης που κατηγοριοποιήθηκαν - ενώ η ομάδα σας κοιμάται. Οι οργανισμοί που το αντιμετωπίζουν αυτό ως περιέργεια θα διαπιστώσουν ότι όσοι το αντιμετωπίζουν ως υποδομή θα έχουν προχωρήσει σημαντικά μπροστά μέχρι τη στιγμή που θα το ξανασκεφτούν. Έχουμε ξαναγράψει για αυτή τη δυναμική στο παρελθόν στο πλαίσιο της τη δική μας στροφή προς την υποστήριξη με τεχνητή νοημοσύνη - το σύνθετο πλεονέκτημα της αυτοματοποίησης δεν είναι ορατό μέχρι να γίνει.


Τι πρέπει να κάνουν οι οργανισμοί τώρα

  • Προσδιορίστε μία επαναλαμβανόμενη, μετρήσιμη ροή εργασίας αυτή την εβδομάδα. Όχι ένα αόριστο "θα πρέπει να αυτοματοποιήσουμε την υποβολή εκθέσεων". Ένας συγκεκριμένος βρόχος: αυτός ο τύπος εγγράφου, επεξεργασμένος με αυτόν τον τρόπο, αξιολογείται με βάση αυτό το κριτήριο. Η αυτόματη έρευνα είναι ένα χρήσιμο νοητικό μοντέλο - αν δεν μπορείτε να περιγράψετε τη ροή εργασίας σας με τον τρόπο που περιγράφει ο Καρπάθιος τον εκπαιδευτικό βρόχο του, δεν είναι ακόμα έτοιμη για την αυτοματοποίηση των πρακτόρων.
  • Επενδύστε στην ποιότητα των δεδομένων πριν από την ανάπτυξη του πράκτορα. Οι αυτόνομοι πράκτορες ενισχύουν οτιδήποτε συνεργάζονται. Τα καθαρά, σταθερά δομημένα δεδομένα εισόδου παράγουν χρήσιμα αυτόνομα αποτελέσματα. Τα ακατάστατα, ασυνεπή δεδομένα παράγουν σίγουρα λανθασμένη αυτόνομη έξοδο - με 100 φορές μεγαλύτερη ταχύτητα από έναν άνθρωπο που κάνει το ίδιο λάθος. Η διακυβέρνηση των δεδομένων είναι πλέον ένα ζήτημα ετοιμότητας της ΤΝ, όχι απλώς ένα ζήτημα νοικοκυρέματος.
  • Αναπροσαρμόστε τη "στρατηγική ΤΝ" ως "ποιους βρόχους αυτοματοποιούμε πρώτοι". Οι περισσότερες επιχειρησιακές στρατηγικές ΤΝ εξακολουθούν να οργανώνονται γύρω από εργαλεία και προμηθευτές. Το πιο χρήσιμο πλαίσιο, μετά την αυτόματη έρευνα, είναι: ποιες από τις ροές εργασίας μας είναι ένας βρόγχος με μετρήσιμο αποτέλεσμα; Κατατάξτε τις με βάση τον όγκο και τον αντίκτυπο. Ξεκινήστε με τον βρόχο με τον υψηλότερο όγκο, με την πιο ξεκάθαρη μέτρηση. Αυτός είναι η πρώτη σας ανάπτυξη πράκτορα.

Τι θα ακολουθήσει

Η αυτόματη αναζήτηση είναι σκόπιμα ελάχιστη - μία GPU, ένα αρχείο, μία μετρική. Το άμεσο επόμενο βήμα, που είναι ήδη ορατό στις διακλαδώσεις της κοινότητας που αναδύονται από το αποθετήριο, είναι παραλλαγές με πολλούς πράκτορες: ένας πράκτορας παράγει υποθέσεις, ένας άλλος εκτελεί πειράματα, ένας τρίτος αξιολογεί και συνθέτει τα αποτελέσματα. Σε επιχειρησιακούς όρους, αυτό αντιστοιχεί σε πλήρη αυτοματοποίηση της ροής εργασίας: εισαγωγή, επεξεργασία, έλεγχος ποιότητας και δρομολόγηση εξόδου που διαχειρίζεται μια συντονισμένη αλυσίδα πρακτόρων με ανθρώπινη εξέταση μόνο σε καθορισμένα σημεία εξαίρεσης.

Η πιο σημαντική αλλαγή είναι πολιτιστική. Η διατύπωση του Karpathy - ότι η έρευνα για την πρωτοποριακή τεχνητή νοημοσύνη "γινόταν από υπολογιστές κρέατος ανάμεσα στο φαγητό, τον ύπνο, την διασκέδαση" - είναι σκόπιμα προκλητική. Αλλά το υποκείμενο σημείο είναι σοβαρό: το ανταγωνιστικό πλεονέκτημα στις εργασίες που γειτνιάζουν με την ΤΝ μετατοπίζεται από την ταχύτητα της ανθρώπινης εκτέλεσης στην ποιότητα των βρόχων που σχεδιάζετε και στη σαφήνεια των μετρήσεων προς τις οποίες βελτιστοποιείτε. Αυτό ισχύει και στην έρευνα ML. Είναι εξίσου αληθές στις επιχειρηματικές αναλύσεις, στις αναφορές κινδύνου και στις ροές εργασίας έντασης εγγράφων. Το ερώτημα δεν είναι πλέον αν πρέπει να κατασκευάσετε αυτούς τους βρόχους. Είναι το πόσο γρήγορα.

Μπορεί επίσης να σας αρέσει...

Δημοφιλείς αναρτήσεις

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *