- Reaksi - Tren AI - 6 menit baca
Apa yang Terjadi
Pada Andrej Karpathy - mantan direktur Tesla AI dan salah satu pendiri OpenAI - menerbitkan pencarian otomatis di GitHubsebuah kerangka kerja sumber terbuka yang memungkinkan agen AI secara mandiri menjalankan eksperimen pembelajaran mesin dalam semalam pada satu GPU. Ide intinya: berikan agen pengaturan pelatihan, tidur, dan bangunkan 100 eksperimen yang telah selesai - masing-masing memodifikasi kode, melatih selama lima menit, memeriksa apakah hasilnya membaik, dan mengulang. Tidak ada manusia dalam perulangan. Agen tidak akan pernah berhenti sampai Anda menghentikannya secara manual. Repo ini melewati 8.000 bintang dalam beberapa hari setelah dirilis.
Apa Arti Sebenarnya dari Hal Ini - Di Balik Hype
Mari kita perjelas apa yang dimaksud dengan pencarian otomatis dan apa yang bukan. Ini bukan AI tujuan umum yang menggantikan ilmuwan data. Ini adalah sebuah lingkaran yang sangat terbatas: satu agen, satu file yang dapat dimodifikasi (train.py), satu jendela evaluasi 5 menit yang tetap, satu metrik untuk dioptimalkan. Yang membuatnya signifikan bukanlah cakupannya - melainkan keputusan arsitektur di belakangnya: agen yang sepenuhnya otonom yang menjalankan eksperimen, membaca hasilnya, memutuskan apa yang akan dicoba selanjutnya, dan mengulangi - dengan instruksi eksplisit dalam kode untuk tidak pernah berhenti dan tidak pernah meminta izin kepada manusia untuk melanjutkannya.
Filosofi desain tersebut - iterasi yang otonom, mandiri, dan digerakkan oleh metrik - adalah template yang sedang bergerak cepat menuju AI perusahaan. Tidak hanya dalam penelitian ML, tetapi dalam domain apa pun yang memiliki tujuan yang jelas, hasil yang terukur, dan ruang pencarian yang cukup besar sehingga iterasi yang dilakukan oleh manusia menjadi penghambatnya. Hal ini menggambarkan sebagian besar dari apa yang dilakukan oleh tim BI dan analitik perusahaan setiap harinya.
Tiga Implikasi Konkret untuk Tim Perusahaan
1. "Agentic" bukan lagi sebuah konsep penelitian - melainkan sebuah pola produksi. Kontribusi Karpathy di sini bukanlah gagasan tentang agen AI; ini menunjukkan bahwa implementasi file tunggal yang bersih, minimal, dapat menjalankan 100 eksperimen yang berarti dalam semalam pada perangkat keras komoditas. Hambatan untuk menerapkan loop AI otonom dalam konteks perusahaan - otomatisasi pelaporan, pengoptimalan jalur data, pemrosesan dokumen - baru saja turun secara signifikan. Tim yang telah menunggu hal ini "matang" harus mengkalibrasi ulang jadwal mereka.
2. Peran manusia bergeser dari melakukan menjadi meninjau. Lingkaran pencarian otomatis tidak meminta persetujuan di antara eksperimen. Ini menghasilkan, menguji, menyimpan apa yang berhasil, membuang apa yang tidak, dan melanjutkan. Dalam istilah perusahaan, hal ini memetakan secara langsung ke sistem AI yang menyusun laporan, menjalankan analisis skenario, atau memproses permintaan yang masuk secara otonom - dan hanya menampilkan hasil yang membutuhkan penilaian manusia. Hal ini bukanlah ancaman bagi para analis yang terampil; ini adalah redistribusi waktu mereka. Lebih sedikit pembuatan, lebih banyak evaluasi.
3. Kualitas data dan metrik keberhasilan yang jelas menjadi hal yang tidak bisa ditawar. Pencarian otomatis bekerja karena memiliki metrik yang tidak ambigu: validasi bit-per-byte. Lebih rendah lebih baik. Setiap percobaan dapat dibandingkan secara objektif. Dalam pengaturan perusahaan, pertanyaan yang setara adalah: berapa "val_bpb" organisasi Anda? Jika Anda tidak dapat mendefinisikan satu kriteria keberhasilan yang terukur untuk alur kerja otomatis, agen otonom tidak dapat mengoptimalkannya. Proyek-proyek yang akan mendapatkan manfaat paling besar dari AI agen adalah proyek-proyek yang telah melakukan pekerjaan untuk mendefinisikan apa arti "lebih baik" secara konkret dan terukur.
Perspektif LeapLytics
Kami telah membangun sistem AI untuk alur kerja perusahaan selama beberapa tahun - pemrosesan dokumen, pelaporan otomatis, otomatisasi dukungan. Pola yang ditunjukkan oleh Karpathy pada lapisan penelitian ML adalah pola yang sama yang kami terapkan pada lapisan proses bisnis: mengidentifikasi loop berulang, mendefinisikan kriteria keberhasilan, membiarkan agen berjalan, dan memunculkan pengecualian untuk ditinjau oleh manusia.
Apa yang dijelaskan oleh autoresearch secara visual adalah perbedaan kecepatan. 100 percobaan dalam 8 jam. Dalam istilah perusahaan: 100 draf dokumen ditinjau, 100 anomali data ditandai, 100 tiket dukungan dikategorikan - sementara tim Anda tidur. Organisasi yang memperlakukan hal ini sebagai keingintahuan akan menemukan bahwa organisasi yang memperlakukannya sebagai infrastruktur telah bergerak jauh ke depan pada saat mereka mempertimbangkannya kembali. Kami telah menulis tentang dinamika ini sebelumnya dalam konteks pergeseran kami sendiri ke dukungan berbantuan AI - keuntungan gabungan dari otomatisasi tidak terlihat sampai hal itu terjadi.
Apa yang Harus Dilakukan Organisasi Sekarang
- Identifikasi satu alur kerja yang berulang dan terukur minggu ini. Bukan "kita harus mengotomatiskan pelaporan." Perulangan tertentu: jenis dokumen ini, diproses dengan cara ini, dievaluasi berdasarkan kriteria ini. Pencarian otomatis adalah model mental yang berguna - jika Anda tidak dapat menggambarkan alur kerja Anda seperti cara Karpathy menggambarkan loop pelatihannya, itu belum siap untuk otomatisasi agen.
- Berinvestasi dalam kualitas data sebelum penerapan agen. Agen otonom memperkuat apa pun yang mereka kerjakan. Data masukan yang bersih dan terstruktur secara konsisten menghasilkan keluaran otonom yang berguna. Data yang berantakan dan tidak konsisten menghasilkan output otonom yang pasti salah - dengan kecepatan 100x lipat dari kecepatan manusia melakukan kesalahan yang sama. Tata kelola data sekarang menjadi pertanyaan kesiapan AI, bukan hanya masalah tata graha.
- Membingkai ulang "strategi AI" sebagai "loop mana yang akan kita otomatisasi terlebih dahulu." Sebagian besar strategi AI perusahaan masih diatur berdasarkan alat dan vendor. Kerangka yang lebih berguna, pasca-penelitian otomatis, adalah: alur kerja mana yang merupakan sebuah lingkaran dengan hasil yang terukur? Urutkan berdasarkan volume dan dampaknya. Mulailah dengan alur dengan volume tertinggi dan paling jelas. Itu adalah penerapan agen pertama Anda.
Apa yang Terjadi Selanjutnya
Pencarian otomatis sengaja dibuat minimal - satu GPU, satu file, satu metrik. Langkah selanjutnya, yang sudah terlihat dalam fork komunitas yang muncul dari repo, adalah varian multi-agen: satu agen menghasilkan hipotesis, agen lain menjalankan eksperimen, agen ketiga mengevaluasi dan mensintesis hasil. Dalam istilah perusahaan, hal ini mengarah pada otomatisasi alur kerja penuh: pemasukan, pemrosesan, pemeriksaan kualitas, dan perutean keluaran yang ditangani oleh rantai agen yang terkoordinasi dengan tinjauan manusia hanya pada titik-titik pengecualian yang ditentukan.
Pergeseran yang lebih penting adalah budaya. Pembingkaian Karpathy - bahwa penelitian AI terdepan "dulunya dilakukan oleh komputer di sela-sela waktu makan, tidur, dan bersenang-senang lainnya" - memang sengaja dibuat provokatif. Namun, poin yang mendasarinya serius: keunggulan kompetitif dalam pekerjaan yang berhubungan dengan AI bergeser dari kecepatan eksekusi manusia ke kualitas loop yang Anda rancang dan kejelasan metrik yang Anda optimalkan. Hal ini berlaku dalam penelitian ML. Hal yang sama juga berlaku dalam analisis perusahaan, pelaporan risiko, dan alur kerja yang padat dokumen. Pertanyaannya bukan lagi apakah akan membangun loop ini. Pertanyaannya adalah seberapa cepat.