Opus 4.6/4.7 доповнює математичні недоліки до рівня навичок програмування, цей показник ECI досить цікавий — він вимірює відносну складність між моделями, а не порівняння з людиною, тому не плутайте його з «перевищенням людських математиків».

Переглянути оригінал
MeNews
Epoch AI випустила карту профілів Claude за спеціалізаціями: навички написання коду залишаються сильними, Opus 4.6 та 4.7 вже виправили математичні недоліки
Аналіз індексу доменно-специфічних здібностей Epoch AI показує, що серія Claude довгий час лідирувала у написанні коду, але має відносно слабкі математичні навички; останні дані свідчать, що ця диспропорція швидко зменшується. Раніше у Claude показник SWE-ECI був вищим за загальний бал, а Math-ECI — відставали, тоді як Opus 4.6/4.7 зменшили різницю до менш ніж 1 бал, заповнивши прогалини. ECI відображає відносну складність завдань для моделей, а не для людини.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено