Незалежна оцінка показала, що MiniMax M2.7 у задачах основних інтелектуальних агентів конкурує з провідними закритими моделями

robot
Генерація анотацій у процесі

ME Новини, повідомлення 4 квітня (UTC+8), нещодавно, згідно з незалежною оцінкою від LangChain, модель з відкритими вагами MiniMax M2.7 досягла рівня, зіставного із закритими (приватними) передовими моделями, у ключових агентських задачах, зокрема керуванні файлами, викликах інструментів та дотриманні інструкцій. У статті зазначається, що її перевага полягає в тому, що витрати суттєво знижено приблизно у 20 разів, а швидкість зросла у 2–4 рази. Наприклад, за щоденного обсягу виведення 10 млн токенів вартість використання Opus 4.6 становить близько 250 доларів США на день, тоді як MiniMax M2.7 потребує лише приблизно 12 доларів США на день. Цей прогрес став можливим завдяки таким відкритим бенчмаркам, як SWE-Rebench і Terminal Bench 2.0, які стимулювали розвиток відкритих моделей, роблячи їх здійсненним варіантом для розгортання агентів у виробничих середовищах, а також дозволяючи їхню спільну роботу з закритими моделями. (Джерело: InFoQ)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити