Anthropic нарешті випустила безпечну версію моделі Mythos Fable-5.


Параметри вже багато обговорювали в мережі, я не буду повторюватися. Більш цікаво — це реальні тестування завдань, зроблені стороннім інструментом програмування Augment Code.
Цей набір тестів пройшов усього 489 програмних завдань, і результати досить цікаві:
Fable-5 явно випереджає за загальним показником і точністю. Загальний бал +0.224, точність +0.191, це дійсно найсильніша на даний момент категорія.
Але ще один важливий нюанс: GPT-5.5 все ще стабільно перемагає Opus-4.8.
Загальний бал GPT-5.5 — +0.164, Opus-4.8 — +0.128; точність GPT-5.5 — +0.141, Opus-4.8 — +0.092.
Це також пояснює моє останнє відчуття: після виходу Opus-4.8 я не відчув явної переваги над GPT-5.5, принаймні у реальних програмних завданнях це відчуття не є ілюзією.
Більш реалістичною проблемою є вартість. Хоча Fable-5 сильна, але споживання токенів і ціна теж високі: приблизно 14.6 тисяч токенів на завдання, вартість — $3.09; у порівнянні GPT-5.5 — 7.5 тисяч токенів, $1.52. Справді сильна модель, але й дуже дорога.
Тому наприкінці знову кажу: сподіваюся, GPT-5.6 з’явиться швидше.
Якщо Fable-5 можна використовувати лише 10 днів у підписковому плані, а потім доведеться викликати через API за звичайною ціною, то вона навряд чи стане звичайним інструментом для щоденної роботи користувачів, а швидше — “розкішною моделлю” для обмеженого кола людей і сценаріїв.
Використання AI-моделей, можливо, справді почне розподілятися за рівнями.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено