Prime Intellect — середовище з відкритим кодом для самовдосконалюваних інтелектуальних агентів: дозволяє ШІ «змагатися» між собою, створюючи понад 8000 тестових інструментів

AIMPACT повідомлення, 19 травня (UTC+8), згідно з моніторингом Beating від Dongcha, Prime Intellect оголосила про відкритий вихідний код для середовища тренування штучних агентів general-agent, яке є повністю самовдосконалюваним синтезованим середовищем. Основною ідеєю цього релізу є перетворення генерації завдань у двовійськову гру: чергування між синтезатором і розв'язувачем, що автоматично побудували великий базу даних станів, яка містить 4504 завдання та понад 8000 унікальних інструментів. Це середовище починається з простих стартових завдань і за допомогою дев’яти стратегій, таких як обмеження умов, шумові інструкції, крос-об’єктове зчеплення, розділяє завдання на п’ять рівнів складності від t0 до t4. Синтезатор відповідає за проектування завдань із базою даних, інтерактивними інструментами та функціями перевірки, тоді як розв'язувач намагається пройти їх. Завдання, рівень складності яких потрапляє у визначений діапазон успішності, зберігаються, а найскладніший рівень використовується як стартовий для наступної еволюції. Офіційні випробування показали, що лише 4400 згенерованих цим середовищем траєкторій для тонкої настройки моделі з 30 мільярдами параметрів підвищили точність виклику інструментів у базовому тесті BFCL з 18,9% до 52,3%. Така механіка дозволяє моделі позбавитися залежності від статичних людських аннотованих датасетів. Завдяки прямій грі між моделями система здатна безперервно автоматично генерувати навчальні дані з контрольованою складністю та семантичною перевіркою. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено