Параметри вже багато обговорювали в мережі, я не буду повторюватися. Більш цікаво — це реальні тестування завдань, зроблені стороннім інструментом програмування Augment Code.
Цей набір тестів пройшов усього 489 програмних завдань, і результати досить цікаві:
Fable-5 явно випереджає за загальним показником і точністю. Загальний бал +0.224, точність +0.191, це дійсно найсильніша на даний момент категорія.
Але ще один важливий нюанс: GPT-5.5 все ще стабільно перемагає Opus-4.8.
Загальний бал GPT-5.5 — +0.164, Opus-4.8 — +0.128; точність GPT-5.5 — +0.141, Opus-4.8 — +0.092.
Це також пояснює моє останнє відчуття: після виходу Opus-4.8 я не відчув явної переваги над GPT-5.5, принаймні у реальних програмних завданнях це відчуття не є ілюзією.
Більш реалістичною проблемою є вартість. Хоча Fable-5 сильна, але споживання токенів і ціна теж високі: приблизно 14.6 тисяч токенів на завдання, вартість — $3.09; у порівнянні GPT-5.5 — 7.5 тисяч токенів, $1.52. Справді сильна модель, але й дуже дорога.
Тому наприкінці знову кажу: сподіваюся, GPT-5.6 з’явиться швидше.
Якщо Fable-5 можна використовувати лише 10 днів у підписковому плані, а потім доведеться викликати через API за звичайною ціною, то вона навряд чи стане звичайним інструментом для щоденної роботи користувачів, а швидше — “розкішною моделлю” для обмеженого кола людей і сценаріїв.
Використання AI-моделей, можливо, справді почне розподілятися за рівнями.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GateIPOAccessSpaceX
6.63M Популярність
#
StrategyAdds1550BTCatLowerPrices
2.89M Популярність
#
IsraelStrikesIranBTCPlunges
56.87K Популярність
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.82M Популярність
#
PredictNBAChampionWin20000U
854.64K Популярність

Закріплено

карта сайту

Anthropic нарешті випустила безпечну версію моделі Mythos Fable-5.

Популярні теми

GateIPOAccessSpaceX

StrategyAdds1550BTCatLowerPrices

IsraelStrikesIranBTCPlunges

StrongNonfarmPayrollsRekindleRateHikeFear

PredictNBAChampionWin20000U

Закріплено