Anthropic випустила Fable 5 з безпечними обмеженнями для розблокування можливостей рівня Mythos

Автор: Лі Дань, Wall Street Journal

На порозі IPO Anthropic випустила важливий продукт.

У вівторок, 9 січня за східним часом, Anthropic офіційно представила Claude Fable 5 і одночасно запустила Claude Mythos 5. Обидва базуються на одній архітектурі нижнього рівня, причому Fable 5 — перша модель рівня Mythos, доступна для публічного використання, а Mythos 5 зберігає більш повний функціонал і наразі доступна лише обмеженому колу довірених організацій.

Anthropic заявила, що Fable 5 стала найпотужнішою моделлю, яку компанія коли-небудь випускала публічно, і досягає провідних позицій у галузі у сферах програмної інженерії, наукових досліджень, фінансового аналізу, візуального розуміння тощо. Це означає, що технологічний шлях Mythos, який раніше був обмежений через сильні можливості мережевої безпеки та захисту, нарешті починає виходити на масовий ринок.

Однак Anthropic суворо обмежила доступ до Fable 5: у питаннях, що стосуються кібербезпеки, біології та хімії, модель автоматично переключається на менш потужну Claude Opus 4.8, щоб знизити ризик зловживань.

Ціноутворення Fable 5 і Mythos 5 становить 10 доларів за мільйон введених токенів і 50 доларів за мільйон виведених токенів. Anthropic зазначила, що ця ціна менша ніж у попередній версії Claude Mythos у два рази, і додала, що випуск нової моделі є кроком вперед у досягненні цілей компанії — швидко та безпечно доставляти передові можливості штучного інтелекту якомога більшій кількості користувачів.

Для Anthropic, яка готується до IPO, це не лише оновлення моделі, а й демонстрація сили перед капітальним ринком — ключовий доказ того, що компанія здатна створювати найпередовіший AI і контролювати ризики.

Наскільки ж потужна модель Fable 5?

За визначенням Anthropic, Fable 5 — перша модель рівня Mythos, яку можна безпечно публічно розгортати.

Anthropic стверджує, що Fable 5 досягає провідних результатів майже у всіх тестових бенчмарках, особливо добре справляється з довгими, багатоступеневими та високовартісними завданнями. Компанія підкреслює: «Чим довше та складніше завдання, тим очевидніша перевага Fable 5 порівняно з іншими моделями.»

Однією з найяскравіших її можливостей є розробка програмного забезпечення.

У ранніх тестах платіжний гігант Stripe виявив, що Fable 5 усього за один день завершила місячну роботу з перенесення коду з великої бази Ruby-коду з 50 мільйонами рядків, яка зазвичай займала б команді два місяці.

У фінансовій та інтелектуальній сферах Anthropic посилається на сторонні оцінки, які стверджують, що Fable 5 отримала найвищі бали у високорівневому фінансовому мисленні, аналізі документів, розумінні таблиць і графіків. Трейдингова компанія IMC зазначила, що модель показала високі результати у тестах пошуку фактів, аналізу причин, концептуальному мисленні та прогнозуванні доходів.

Візуальні можливості також значно покращилися.

Anthropic стверджує, що Fable 5 здатна витягати точні дані з складних наукових графіків і навіть відновлювати вихідний код веб-застосунків лише за скріншотом. У внутрішньому тесті модель, базуючись лише на візуальній інформації, пройшла рівень у грі Pokémon FireRed, тоді як попередня версія Claude для цього потребувала додаткових інструментів.

Крім того, Fable 5 додатково покращила довгий контекст і тривалу пам’ять. Anthropic заявила, що модель здатна зберігати концентрацію у завданнях тривалістю мільйони токенів і використовувати власні нотатки для постійної оптимізації результатів.

Митос 5 — потужніший, але публічно ще недоступний

Разом із Fable 5 був представлений і довгоочікуваний Mythos 5.

Anthropic повідомила, що обидві моделі фактично базуються на одному й тому ж нижньому рівні, але Mythos 5 позбавлений частини обмежень безпеки, тому зберігає більш повний функціонал у сферах кібербезпеки та наукових досліджень.

Компанія планує, що Mythos 5 буде доступна лише через спеціальну ініціативу Project Glasswing для обмеженого кола організацій, які пройдуть сувору перевірку, зокрема урядові структури США, оператори критичної інфраструктури та організації з кіберзахисту.

Anthropic заявила, що цей модель має «найсильніші у світі можливості кібербезпеки» і у майбутньому буде поступово розширювати доступ через «Програму довіреного доступу» (Trusted Access Program).

У галузі біології та медицини Anthropic також поділилася вражаючими результатами експериментів.

Згідно з повідомленнями, Mythos 5 вже здатна самостійно виконувати процеси дизайну білків і досягати або перевищувати рівень дослідників у деяких задачах розробки ліків. Команда дослідників також повідомила, що модель висунула нову гіпотезу щодо механізму дії білка бактерії Escherichia coli, яка згодом була підтверджена незалежними лабораторними дослідженнями.

Що відбулося з відкриттям і комерційним запуском Mythos?

Найбільший інтерес викликає те, що Anthropic нарешті вирішила головну проблему, яка раніше стримувала публічне розгортання Mythos.

На початку цього року, коли компанія вперше показала Mythos Preview, це викликало бурхливу реакцію у галузі. Рідко коли AI-компанії попереджали, що модель здатна знаходити та використовувати уразливості у системах і браузерах, демонструючи безпрецедентні можливості у сфері кіберзахисту, і тому вирішили тимчасово не відкривати її для публіки.

Це рішення було дуже рідкісним у галузі AI.

Зазвичай компанії прагнуть швидко розширити доступ до моделей, а Anthropic обрала обмежити його, дозволяючи тестування лише обмеженому колу партнерів. Раніше Project Glasswing охоплював близько 50 організацій, а нещодавно їх кількість зросла до майже 200.

Щоб сприяти публічному запуску, Anthropic додала до Fable 5 кілька рівнів безпеки.

Коли система виявляє запити, що стосуються кібербезпеки, біології, хімії або модульного дистилювання, користувач отримує відповідь від Claude Opus 4.8, а не від Fable 5. Компанія стверджує, що рівень таких обмежень становить менше 5%.

Anthropic також провела понад 1000 годин внутрішніх «тестів на злом» (Jailbreak Testing), намагаючись знайти способи обійти обмеження безпеки. У компанії повідомили, що тестувальники не змогли знайти універсальні способи обходу захисту.

Ключовий етап перед IPO: Anthropic намагається довести, що можливості та безпека можуть йти рука об руку

З комерційної точки зору, випуск Fable 5 і Mythos 5 припадає на найважливіший етап розвитку Anthropic.

Наприкінці травня компанія завершила раунд фінансування на 6,5 мільярдів доларів, після чого її оцінка сягнула 96,5 мільярдів доларів, що зробило її однією з найбільших AI-компаній у світі за капіталізацією, випереджаючи OpenAI. У червні компанія таємно подала документи на IPO, щоб якомога швидше вийти на ринок цієї осені.

Головне питання, яке цікавить ринок: чи зможе Anthropic перетворити свої передові дослідження у масштабний комерційний продукт.

Раніше Mythos вважався одним із найсучасніших у галузі систем кібербезпеки AI, але через ризики безпеки його не можна було широко використовувати, і його комерційна цінність була обмеженою. Тепер, з випуском Fable 5, Anthropic знайшла компроміс — зберігаючи більшу частину передових можливостей, вона використовує динамічне маршрутизацію та контроль доступу для забезпечення безпеки.

Ця модель має важливе значення для потенційних інвесторів.

З одного боку, Anthropic демонструє, що її технологічний рівень залишається на передовій галузі; з іншого — вона показує свою здатність до управління моделями та ризиками, що стає все більш важливим для регуляторів і капіталу.

Також компанія підвищила ціну на високорівневі моделі. Ціни Fable 5 і Mythos 5 становлять 10 доларів за мільйон введених токенів і 50 доларів за мільйон виведених, що у два рази дорожче за Opus 4.8, але Anthropic вважає, що підвищена ефективність компенсує частину витрат.

З наближенням IPO Anthropic розповідає нову історію для капітального ринку: не лише має один із найпотужніших AI-моделей, а й здатна балансувати між безпекою, регулюванням і комерціалізацією. І Fable 5 — це найновіший центральний продукт цієї історії.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено