Prime Intellect — среда для открытого исходного кода самовоспроизводящегося интеллектуального агента: позволяет ИИ «бороться и сотрудничать» и создавать более 8000 тестовых инструментов

AIMPACT сообщение, 19 мая (UTC+8), согласно мониторингу 动察 Beating, Prime Intellect объявила об открытом исходном коде среды обучения интеллектуальных агентов general-agent, которая представляет собой полностью синтезированную среду с возможностью самовосстановления. Основная идея этого релиза — превратить постановку задач в двоевую игру между синтезатором и решателем: они по очереди соревнуются друг с другом, и в настоящее время автоматически создана крупная база данных состояний, содержащая 4504 задачи и более 8000 уникальных инструментов. Эта рамочная структура начинается с простых стартовых задач, и с помощью 9 стратегий — таких как условные ограничения, шумовые инструкции, межобъектовая связка — задачи разбиваются на пять уровней сложности: t0 до t4. Синтезатор отвечает за проектирование задач с базой данных, интерактивными инструментами и функциями проверки, а решатель — за попытки пройти их. Только задачи, у которых уровень успешности попадает в определённый диапазон сложности, сохраняются, а самые сложные уровни служат стартовой точкой для следующей волны эволюции. Официальные тесты показали, что при использовании более 4400 сгенерированных в этой среде траекторий для дообучения модели с 30 миллиардов параметров точность вызова инструментов на базе BFCL увеличилась с 18,9% до 52,3%. Эта механика позволяет моделям избавиться от зависимости от статичных аннотированных данных. Благодаря прямой игре между моделями система может непрерывно автоматически генерировать учебные материалы с контролируемой сложностью и семантической проверкой. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено