Автодослідження - Андрій Карпатій щойно випустив автономних агентів ШІ, які проводять дослідження протягом ночі - ось що це означає для корпоративного ШІ

- Реакція - тенденції штучного інтелекту - 6 хв читати


Що сталося

На Андрій Карпатій - колишній директор Tesla AI та співзасновник OpenAI - опублікував статтю автопошук на GitHubфреймворк з відкритим вихідним кодом, який дозволяє агентам ШІ автономно запускати експерименти з машинного навчання протягом ночі на одному графічному процесорі. Основна ідея: дайте агенту налаштування для навчання, лягайте спати і прокидайтеся зі 100 завершеними експериментами - кожен з яких модифікує код, тренується протягом п'яти хвилин, перевіряє, чи покращився результат, і повторює його. Жодної людини в циклі. Агент ніколи не зупиняється, поки ви не перервете його вручну. За кілька днів після релізу репо перетнуло 8 000 зірок.


Що це насправді означає - за межами галасу

Давайте уточнимо, чим є і чим не є автодослідження. Це не універсальний штучний інтелект, який замінює аналітиків даних. Це вузькоспеціалізований цикл: один агент, один файл, який він може модифікувати (train.py), одне фіксоване 5-хвилинне вікно оцінювання, одна метрика для оптимізації. Що робить його важливим, так це не обсяг - це архітектурне рішення за ним: повністю автономний агент, який запускає експеримент, зчитує результат, вирішує, що спробувати далі, і повторює - з явною інструкцією в коді, щоб ніколи не зупиняйтеся і не питайте дозволу людини продовжувати.

Ця філософія проектування - автономна, самокерована, керована метриками ітерація - є шаблоном, до якого швидко рухається корпоративний ШІ. Не тільки в дослідженнях ML, але і в будь-якій області, де є чітка мета, вимірюваний результат і досить великий простір пошуку, де ітерації, що виконуються людиною, є вузьким місцем. Це описує значну частину того, що команди корпоративних аналітиків та аналітиків роблять щодня.


Три конкретні наслідки для корпоративних команд

1. "Агентивність" - це вже не дослідницька концепція, а виробнича модель. Внесок Karpathy полягає не в ідеї ШІ-агентів; він показує, що чиста, мінімальна, однофайлова реалізація може запустити 100 значущих експериментів за одну ніч на звичайному апаратному забезпеченні. Бар'єр для розгортання автономних циклів ШІ в корпоративному контексті - автоматизація звітності, оптимізація конвеєрів даних, обробка документів - щойно значно знизився. Командам, які чекали, поки це "дозріє", варто переглянути свої часові рамки.

2. Роль людини зміщується від виконання до аналізу. Цикл автодослідження не просить схвалення між експериментами. Він генерує, тестує, зберігає те, що працює, відкидає те, що не працює, і рухається далі. З точки зору підприємства, це безпосередньо відповідає системам штучного інтелекту, які складають звіти, проводять аналіз сценаріїв або обробляють вхідні запити автономно - і виводять на поверхню лише ті результати, які потребують людського судження. Це не загроза для кваліфікованих аналітиків; це перерозподіл їхнього часу. Менше генерувати, більше оцінювати.

3. Якість даних та чіткі показники успіху не підлягають обговоренню. Автопошук працює, тому що він має однозначну метрику: кількість бітів перевірки на байт. Чим менше, тим краще. Кожен експеримент об'єктивно можна порівняти. В корпоративних умовах еквівалентним питанням є: який "val_bpb" вашої організації? Якщо ви не можете визначити єдиний вимірюваний критерій успіху для автоматизованого робочого процесу, автономні агенти не зможуть оптимізуватися під нього. Проекти, які отримають найбільшу користь від агентного ШІ, - це ті, які вже виконали роботу з визначення того, що означає "краще" в конкретних, вимірюваних термінах.


Перспектива LeapLytics

Ми вже кілька років створюємо системи штучного інтелекту для робочих процесів на підприємствах обробка документів, автоматизована звітність, автоматизація підтримки. Шаблон, який демонструє Карпатія на рівні дослідження ML, - це той самий шаблон, який ми застосовуємо на рівні бізнес-процесів: ідентифікувати повторюваний цикл, визначити критерій успіху, запустити агента і вивести винятки на поверхню для перевірки людиною.

Автодослідження дає чітке уявлення про те, що диференціал швидкості. 100 експериментів за 8 годин. У термінах підприємства: 100 проектів документів переглянуто, 100 аномалій даних позначено, 100 заявок на підтримку класифіковано - поки ваша команда спить. Організації, які ставляться до цього як до курйозу, виявлять, що ті, які ставляться до цього як до інфраструктури, значно просунулися вперед на той час, коли вони переглянуть свої погляди. Ми вже писали про цю динаміку раніше в контексті наш власний перехід на підтримку зі штучним інтелектом - складова перевага автоматизації не помітна, доки вона не стане такою.


Що організації повинні робити зараз

  • Визначте один повторюваний, вимірюваний робочий процес на цьому тижні. Не розпливчасте "треба автоматизувати звітність". Конкретний цикл: цей тип документа, оброблений таким чином, оцінений за цим критерієм. Автопошук є корисною ментальною моделлю - якщо ви не можете описати свій робочий процес так, як Карпаті описує свій цикл навчання, він ще не готовий до автоматизації агентів.
  • Інвестуйте в якість даних перед розгортанням агента. Автономні агенти підсилюють те, з чим вони працюють. Чисті, послідовно структуровані вхідні дані дають корисні автономні результати. Безладні, непослідовні дані призводять до впевнено помилкових автономних висновків - зі швидкістю, у 100 разів більшою, ніж у людини, яка припускається тієї ж помилки. Управління даними - це вже питання готовності до ШІ, а не просто ведення домашнього господарства.
  • Перефразуйте "стратегію ШІ" як "які цикли ми автоматизуємо в першу чергу". Більшість корпоративних стратегій штучного інтелекту все ще організовані навколо інструментів і постачальників. Більш корисною після дослідження є наступна схема: який з наших робочих процесів є циклом з вимірюваним результатом? Проранжуйте їх за обсягом і впливом. Почніть з циклу з найбільшим обсягом і найчіткішою метрикою. Це ваше перше розгортання агента.

Що буде далі

Автодослідження навмисно зведено до мінімуму - один графічний процесор, один файл, одна метрика. Наступним кроком, вже помітним у форках спільноти, що з'являються на репозиторії, є багатоагентні варіанти: один агент генерує гіпотези, інший проводить експерименти, третій оцінює і синтезує результати. З точки зору підприємства, це означає повну автоматизацію робочого процесу: прийом, обробка, перевірка якості та маршрутизація вихідних даних здійснюється скоординованим ланцюжком агентів із залученням людини лише у визначених виняткових випадках.

Більш важливий зсув - культурний. Фреймінг Карпаті - що дослідженнями в галузі ШІ "раніше займалися м'ясні комп'ютери в перервах між їжею, сном та іншими розвагами" - навмисно провокативний. Але в основі лежить серйозна річ: конкурентна перевага в суміжних зі штучним інтелектом роботах зміщується від швидкості виконання людиною до якості розроблених циклів і чіткості метрик, до яких ви оптимізуєте. Це справедливо для досліджень у галузі ML. Це так само вірно для корпоративної аналітики, звітності про ризики та документомістких робочих процесів. Питання вже не в тому, чи будувати ці цикли. Питання в тому, як швидко.

Вам також може сподобатися...

Популярні публікації

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *