GLM-5.1 посів перше місце у відкритому коді LMArena та третє у світі

robot
Генерація анотацій у процесі

Згідно з моніторингом 1M AI News, сьогодні глобальна авторитетна платформа для оцінки штучного інтелекту LMArena (участь мільйона користувачів у сліпому тестуванні) оновила спеціальний рейтинг Code Arena, де GLM-5.1 посів перше місце серед відкритих моделей у світі, посівши третє місце у глобальному рейтингу моделей. GLM-5.1 не лише успадкувала передові відкриті можливості кодування попереднього покоління моделей, але й досягла прориву у довгострокових завданнях (Long-Horizon Task), реалізувавши: 1. побудову Linux-робочого столу за 8 годин з нуля; 2. 655 ітерацій, що подолали обмеження оптимізації векторної бази даних; 3. 1000 раундів оптимізації викликів інструментів для реального навантаження моделей машинного навчання. Варто зазначити, що за однаковими стандартами оцінки у рейтингу METR, GLM-5.1 є єдиною відкритою моделлю, яка здатна працювати безперервно протягом 8 годин, і однією з небагатьох моделей у світі, окрім Claude Opus 4.6, що має цю здатність.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити