Відкритий код GLM-5.2 з неймовірною співвідношенням ціна-якість, вартість менше ніж четверта частина Opus 4.8, але різниця у баллах всього 90, ця оцінка змусила мене щиро сказати: "Дуже круто"

Переглянути оригінал
CoinNetwork
AA-Зв'язка: Claude Fable 5 переміг, GLM-5.2 увійшов до трійки лідерів
Artificial Analysis випустила перший у своєму роді тестовий базовий набір для оцінки довгострокових знань у великих моделях-агентах, що охоплює сценарії науки даних, управління продуктами, банківської операційної діяльності та стратегій важкої промисловості, з 91 завданням, розробленим експертами з Google, McKinsey та Boston Consulting. Результати показали, що Claude Fable 5 посів перше місце, Opus 4.8 — друге, а GLM-5.2 — третє; але за стандартом повної правильності у кожній задачі, рівень ідеальності Fable 5 становить лише 3%. Загальний бал відкритого коду GLM-5.2 лише на 90 балів нижчий за Opus 4.8, але коштує менш ніж у 25% від його вартості.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено