Prime Intellect відкритий платформою Lab: Агент після тренування робиться замкнутим циклом, оплата за токенами, а не за час роботи GPU

robot
Генерація анотацій у процесі

Звіт з CoinWorld, Prime Intellect оголосила, що її платформа для тренування агентів Lab перейшла від бета-версії до повноцінної версії.
Ця платформа об’єднує оцінювання, тренування з підкріпленим навчанням (RL), розгортання адаптерів та інференцію у замкнуту петлю, дозволяючи користувачам визначати завдання та критерії оцінки, а платформа автоматично керує моделлю, що повторює помилки у завданнях, збирає сигнали винагороди та тренує адаптери Lora.
Тренування оплачується за токени, а не за час роботи GPU, базуючись на відкритому фреймворку Prime-RL компанії.
Перший набір підтримує 14 моделей від NVIDIA, OpenAI, Meta та Qwen, з параметрами від 1 мільярда до 70 мільярдів, охоплюючи щільні та MOE архітектури.
Prime Intellect заснована у 2023 році, з загальним залученням понад 70 мільйонів доларів США, раунд А очолений Founders Fund, раунд B — Radical Ventures.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити