Последняя точка зрения Карпати об агентах: крупные компании не掌握核心技术 агентов, индивидуальные разработчики доминируют на переднем крае.

robot
Генерация тезисов в процессе

Андрей Карпати поделился последними внутренними взглядами на агентов, прямо указав на самую большую ошибку в современной области ИИ: люди заставляют агентов работать, полностью игнорируя необходимость сначала досконально освоить базовые большие модели. AK сказал противоречащий здравому смыслу вывод: на передовой агентов сейчас находятся не крупные компании, а независимые разработчики и стартапы. Видео прилагаю в конце статьи.

Ещё в 2016 году OpenAI наступила на эти же грабли и заплатила за это целых пять лет времени.

Ключевая логика, которую хочет донести Карпати: первый шаг — немедленно прекратить иллюзию, что агент может всё, и сначала разобраться в базовой модели. Второй шаг — осознать реальность индустрии: сделать демо чрезвычайно просто, но создание продукта требует десяти лет. Автономное вождение уже подтвердило это: если пропустить этап фундамента, всё построенное рухнет мгновенно. Третий шаг — понять, что агент сам по себе не является продуктом; настоящая основа — базовая большая модель. Если создать хороший фундамент, агенты появятся естественным образом.

Возвращаясь к опыту в OpenAI в 2016 году, Карпати вместе с Тимом Ши и Джимом Фаном участвовал в проекте World Bit. Их изначальной целью было заставить агентов обучения с подкреплением выйти за рамки игровых тестов, таких как Montezuma's Revenge, и попробовать использовать компьютер, клавиатуру и мышь.

Они хотели, чтобы агенты выполняли действительно полезные повседневные задачи, например, бронировать авиабилеты или заказывать еду на чрезвычайно простых веб-страницах. Тогда они заставляли ИИ бешено кликать мышью и нажимать кнопки клавиатуры, пытаясь по наитию прорваться в более продвинутый интеллектуальный мир. Результат очевиден: проект полностью провалился.

В то время технологии просто не позволяли этого. У команды был только один молоток — обучение с подкреплением. Правильным шагом в тот момент было полностью забыть об агентах ИИ и сосредоточить все усилия на построении языковых моделей.

Пять лет спустя, после краткого знакомства с автономным вождением, Карпати обнаружил, что агенты ИИ снова стали главной темой в индустрии, но весь инструментарий кардинально изменился. Сегодня методы решения этих проблем были полностью перестроены: разработчикам агентов, скорее всего, вообще не нужны технологии обучения с подкреплением. Такая эволюция превзошла все ожидания того времени.

Сейчас все狂热追捧 агентов, потому что легко провести параллель: общий искусственный интеллект в конечном итоге обязательно проявится в виде какого-то агента ИИ. В будущем, вероятно, появятся целые группы агентов, даже формирующие огромные организации или цивилизации цифровых сущностей. Это звучит воодушевляюще.

Перед лицом этой狂热 Карпати решил остудить пыл. Существует большая категория проблем, где легко проявить воображение и сделать крутые демонстрации, но превратить их в реальный продукт чрезвычайно сложно.

Автономное вождение — яркий пример. Представить машину, которая сама ездит по кварталу, и сделать демо очень легко, но довести это до реально работающего продукта нужно десять лет. VR-сфера аналогична. Агенты полностью соответствуют этой характеристике: представить и сделать демо просто, но чтобы заставить их действительно работать, разработчикам нужно быть готовыми биться десять лет.

В поисках новых идей Карпати предлагает снова черпать вдохновение в нейронауке. Так поступали на ранних этапах глубокого обучения, и теперь при разработке агентов вполне можно снова обратиться к принципам работы мозга.

Полноценная цифровая сущность должна обладать всеми когнитивными инструментами, которые есть у человека. Помимо языковой модели как части решения, ей нужен внутренний помощник для планирования и рефлексии действий заранее.

Структура мозга даёт идеальный ориентир. Аналог гиппокампа в агенте ИИ — это запись следов памяти с использованием векторных эмбеддингов для индексации и извлечения. Зрительную и слуховую кору цифровой сущности мы примерно знаем, как построить. Также стоит задуматься о роли таламуса. Таламус отвечает за интеграцию всей информации; можно сказать, что это местонахождение сознания. Когда несколько цифровых сущностей борются за контроль и микрофон, чтобы решить, что делать дальше, таламус обрабатывает этот сложный конфликт. Карпати особенно рекомендовал книгу Дэвида Иглмена «Мозг и поведение», считая, что нейронаука содержит отличные идеи для проектирования цифровых индивидов.

Наконец, Карпати поделился чрезвычайно переломной отраслевой реальностью.

На передовой возможностей агентов ИИ сейчас, без сомнения, находятся независимые разработчики и стартапы, которые прямо сейчас строят агентов. Такие лаборатории больших языковых моделей, как OpenAI или DeepMind, в настоящее время не стоят на передовой в гонке агентов.

OpenAI очень сильны в обучении огромных трансформерных языковых моделей. Если сейчас выйдет статья, предлагающая новый метод обучения трансформеров, внутри OpenAI, скорее всего, уже пробовали это два с половиной года назад и точно знают, в чём причина успеха или неудачи. Крупные компании имеют абсолютный технологический барьер в этой области.

Когда выходит статья о новом типе агентов, ситуация совершенно иная. Команды крупных компаний тоже удивляются, потому что они не вели секретных разработок в этом конкретном направлении пять лет. Это означает, что гиганты на этом треке должны соревноваться со всеми стартаперами и хакерами на равных.

Для обычных разработчиков, которые сейчас создают агентов, вы находитесь на передовой этой преобразующей технологии.

Источник статьи: AI寒武纪

Предупреждение о рисках и отказ от ответственности

        Рынок сопряжён с рисками, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает особые инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователям следует учитывать, соответствуют ли любые мнения, взгляды или выводы в данной статье их конкретной ситуации. Инвестиции на основе этой статьи осуществляются на свой страх и риск.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено