Остання точка зору Karpathy щодо Agent: великі компанії не володіють основними технологіями агентів, індивідуальні розробники панують на передовій.

robot
Генерація анотацій у процесі

Андрей Карпатій у своєму останньому внутрішньому огляді щодо агентів прямо вказав на найбільшу помилку в сучасній сфері ШІ: люди змушують агентів працювати, повністю ігноруючи необхідність спочатку досконало опанувати базові великі моделі. АК сказав несподіваний висновок: на передньому краї агентів сьогодні стоять не великі компанії, а незалежні розробники та підприємці. Відео я додав у кінці статті.

Ще у 2016 році OpenAI потрапила в цю пастку та заплатила за це цілих п'ять років.

Головна логіка, яку Карпатій хоче донести: по-перше, негайно припинити фантазії про те, що агенти можуть робити все, і спочатку розібратися з базовими моделями. По-друге, визнати реальність індустрії: зробити демонстрацію надзвичайно легко, але створити продукт потребує десяти років. Автономне водіння вже підтвердило це: якщо пропустити етап фундаменту, все побудоване зруйнується миттєво. По-третє, зрозуміти, що агенти самі по собі зовсім не є продуктом; справжнє ядро — це базові великі моделі. Як тільки фундамент буде закладено, агенти природним чином з'являться.

Згадуючи досвід у 2016 році в OpenAI, Карпатій разом з Тімом Ши та Джимом Фаном брав участь у проекті під назвою "World of Bits". Їхньою початковою метою було змусити агентів з підкріплювальним навчанням вийти з таких тестів, як відеоігри, і перестати грати в "Montezuma's Revenge", а натомість спробувати використовувати комп'ютер, клавіатуру та мишу.

Вони хотіли, щоб агенти виконували справді корисні повсякденні завдання, наприклад, бронювати авіаквитки або замовляти їжу на надзвичайно простих веб-сторінках. Тоді вони змушували ШІ шалено клацати кнопками миші та клавіатури, намагаючись удачею прорватися у більш просунутий інтелектуальний світ. Результат був очевидний: проект повністю провалився.

Технології того часу просто не були готові. Єдиним молотком у команді було підкріплювальне навчання. Правильним підходом у той момент було повністю забути про агенти ШІ й зосередити всі зусилля на створенні мовних моделей.

П'ять років потому, після короткого занурення в автономне водіння, Карпатій виявив, що агенти ШІ знову стали абсолютним трендом в індустрії, але весь інструментарій уже зазнав кардинальних змін. Сьогодні підходи до вирішення цих проблем повністю переосмислені; розробникам агентів, швидше за все, не потрібно використовувати жодних технік підкріплювального навчання. Така еволюція перевершила всі очікування того часу.

Зараз усі сліпо захоплюються агентами, тому що легко уявити, що загальний штучний інтелект зрештою з'явиться у формі якогось ШІ-агента. У майбутньому, ймовірно, з'являться цілі рої агентів, що навіть утворять величезні організації або цивілізації цифрових сутностей. Це звучить справді надихаюче.

Зіткнувшись із цим захопленням, Карпатій вирішив полити холодною водою. Існує великий клас проблем, які легко уявити, легко зробити круту демонстрацію, але надзвичайно важко перетворити на реальний продукт.

Автономне водіння є надзвичайно типовим прикладом. Уявити, як автомобіль самостійно їде кварталом і зробити демонстрацію, дуже легко, але створення реального продукту, який можна впровадити, потребує десяти років. Те саме стосується сфери VR. Агенти також ідеально відповідають цій характеристиці: уявити й зробити демонстрацію легко, але щоб змусити їх справді працювати, розробники повинні бути готові до десяти років наполегливої праці.

У пошуках нових ідей Карпатій пропонує знову черпати натхнення з нейронауки. Саме так робили на ранніх етапах глибокого навчання; тепер, розробляючи агенти, можна знову звернутися до принципів роботи мозку.

Цифрова сутність повинна мати всі когнітивні інструменти, які має людина. Окрім мовної моделі як частини рішення, потрібен внутрішній помічник для попереднього планування та рефлексії поведінки.

Структура мозку надає ідеальний зразок. Еквівалентом гіпокампу в ШІ-агентах є запис слідів пам'яті з використанням технології векторного вбудовування для індексації та пошуку. Ми приблизно знаємо, як побудувати зорову та слухову кору для цифрових сутностей. Також варто глибоко обміркувати роль таламуса. Таламус відповідає за інтеграцію всієї інформації, можна сказати, що це місцеперебування свідомості. Коли кілька цифрових сутностей змагаються за контроль і мікрофон, щоб визначити наступну дію, таламус відповідає за вирішення цього складного конфлікту. Карпатій також особливо рекомендував книгу Девіда Іґлмена "Мозок і поведінка", вважаючи, що нейронаука містить чудові ідеї для проєктування цифрових індивідів.

Нарешті, Карпатій поділився надзвичайно революційним станом індустрії.

Ті, хто сьогодні стоять на передньому краї можливостей ШІ-агентів, безсумнівно, це незалежні розробники та підприємці, які зараз створюють агентів. OpenAI або DeepMind, великі лабораторії мовних моделей, наразі не є на передовій у гонці агентів.

OpenAI дуже добре вміє тренувати великі трансформерні мовні моделі. Якщо зараз вийде стаття, яка пропонує новий метод тренування трансформерів, то, швидше за все, в OpenAI вже пробували це два з половиною роки тому й точно знають основні причини успіху чи невдачі. Великі компанії мають абсолютний технологічний бар'єр у цій сфері.

Коли публікується стаття про новий тип агента, ситуація зовсім інша. Команди великих компаній також будуть вражені, тому що вони не проводили секретних досліджень у цьому конкретному напрямку протягом п'яти років. Це означає, що гіганти в цій гонці повинні змагатися з усіма базовими підприємцями та хакерами.

Для звичайних розробників, які зараз створюють агенти, ви перебуваєте на передньому краї цієї трансформаційної технології.

Джерело цієї статті: AI寒武纪

Попередження про ризики та відмова від відповідальності

        Ринок пов'язаний з ризиками, інвестування потребує обачності. Ця стаття не є інвестиційною рекомендацією і не враховує індивідуальні інвестиційні цілі, фінансовий стан або потреби окремих користувачів. Користувачі повинні оцінювати, чи відповідають будь-які думки, погляди або висновки в цій статті їхній конкретній ситуації. Інвестування на основі цієї статті здійснюється на ваш власний ризик.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено