#Anthropic发布Fable5模型 Модель, два імені: Anthropic випускає Fable 5 та Mythos 5, найпотужніші моделі, відкриті для публіки вперше


9 червня Anthropic одночасно випустила дві нові моделі — Claude Fable 5 та Claude Mythos 5. Цікаво, що вони фактично базуються на одній і тій самій основній моделі, єдина різниця — у ступені "захисту безпеки". Це перший випадок, коли найпотужніша модель Anthropic стала доступною публічно, і це також рідкий експеримент "шарового випуску".
Ця стаття допоможе вам зрозуміти: що робить її потужною, чому вона має два імені та як її використовувати зараз.
1. Спершу уточніть: що таке модель "рівня Mythos"?
Знайомі з Claude? Читачі знають, що моделі Anthropic завжди поділяються на три рівні: Haiku (швидка), Sonnet (збалансована), Opus (найпотужніша). У квітні цього року Anthropic тихо ввела новий рівень вище за Opus — рівень Mythos. Перша модель рівня Mythos (Claude Mythos Preview) не продавалася публічно, а була випущена через проект Project Glasswing у співпраці з урядом США і була доступна лише обраним кібербезпековим агентствам та провайдерам критичної інфраструктури.
Причина проста: цей рівень моделі надто потужний, його можна неправомірно використовувати у сферах, таких як кібератаки та біологічні дослідження, тому Anthropic вважає, що його не слід випускати безпосередньо.
Обидві моделі, випущені цього разу, є офіційними версіями рівня Mythos:
◆ Claude Fable 5: версія для всіх з новим набором захистів;
◆ Claude Mythos 5: версія з частковим зняттям обмежень, доступна лише довіреним партнерам, наприклад Glasswing. Обидві базуються на одній і тій самій основній моделі. Імена також ретельно обрані: Fable походить від латинського fabula ("історія, розказана"), і має коріння у грецькому mythos — той самий походження, різниця лише у "змозі говорити вільно".
2. Наскільки вона потужна?
За словами Anthropic, Fable 5 перевершує будь-яку модель, яку компанія коли-небудь публічно випускала, і є найсучаснішою (SOTA) майже за всіма AI-бенчмарками, особливо виділяючись у програмній інженерії, знаннявій роботі, візуальному розумінні та наукових дослідженнях. Чим довше і складніше завдання, тим більше її перевага над старими моделями.
Кодинг: стискає два місяці в один день. Компанія платіжних систем Stripe у ранньому тестуванні повідомила, що Fable 5 завершила повну міграцію Ruby-коду обсягом 50 мільйонів рядків за один день — те, що зазвичай займало б команді понад два місяці ручної роботи. У оцінюванні Cognition (розробника Devin) FrontierCode Fable 5 набрав найвищий бал серед передових моделей і використовував менше токенів.
Візуальні можливості: проходить Pokémon FireRed без допомоги. Попередні моделі Claude потребували складних додаткових інструментів (карти, навігація, інформація про стан гри), щоб ледве просуватися у Pokémon, але Fable 5 пройшов гру просто дивлячись на екран. Також він може відновлювати вихідний код веб-додатку безпосередньо з скріншотів.
Пам’ять: робить нотатки під час гри у Slay the Spire. У завданнях з мільйонами токенів Fable 5 може зберігати фокус і покращувати продуктивність, використовуючи власні нотатки. У тестах із картковою грою Slay the Spire, після отримання постійної пам’яті, його продуктивність зросла утричі порівняно з Opus 4.8.
Наукові дослідження: прискорює розробку ліків приблизно у 10 разів. Внутрішні експерти з проектування білків у Anthropic використовували Mythos 5 для прискорення частин процесу розробки ліків приблизно у десять разів — моделі самостійно виконували завдання, такі як вибір місць зв’язування, запуск інструментів проектування білків і відновлення збоїв, без людської допомоги. З 14 цілей білків 9 дали перспективні кандидатні ліки для подальшого розвитку. Також вона запропонувала нову механістичну гіпотезу щодо білків E. coli, яка пізніше була підтверджена незалежною дослідницькою лабораторією.
3. Як працює захист безпеки: викликає "пониження" до Opus 4.8
Це найцікавіший аспект випуску. Fable 5 обладнана новим набором класифікаторів — системою штучного інтелекту, окремою від основної моделі, — розробленою для виявлення потенційного зловживання. Коли класифікатор виявляє, що ваш запит стосується будь-якої з трьох чутливих сфер, відповідь більше не буде надходити від Fable 5, а автоматично переключиться на менш потужну модель, Claude Opus 4.8 (з повідомленням для користувача):
1. Кібербезпека: рівень Mythos дуже здатний виявляти та експлуатувати вразливості програмного забезпечення, а також може виконувати "автономне злом" — розвідку та латеральний рух у одному пакеті. Ці можливості значно знижують вартість кібератак, тому основна увага приділяється захисту.
2. Біологія та хімія: модель тепер може виконувати реальні наукові завдання (наприклад, прогнозування зборки вірусних капсидів). Такі двонапрямні можливості небезпечні у зловмисних руках, тому більшість запитів у біотехнології знижуються до Opus.
3. Атаки на дистиляцію: запобігають масштабному "видобутку" можливостей Fable 5 для тренування конкурентних моделей.
Ключові цифри: тригер захисту спрацьовує у менш ніж 5% сесій, тобто понад 95% користувачів отримують майже повний доступ до можливостей Mythos 5. Anthropic визнає, що захист консервативно налаштований і може давати хибні спрацьовування, і планує скоро зменшити кількість хибних спрацьовувань. Щодо jailbreak-атак, понад 1000 годин зовнішнього тестування з пошуку вразливостей не виявили "універсального jailbreak".
Ще одна важлива зміна: весь трафік з моделей рівня Mythos зберігатиметься протягом 30 днів (включно з корпоративними клієнтами) для захисту від нових методів атак і jailbreak-атак — Anthropic обіцяє, що ці дані не використовуватимуться для тренування і матимуть заходи конфіденційності, такі як аудит доступу.
4. Mythos 5: версія "довіреного кола" без захистів
Mythos 5 — це по суті Fable 5 з частковим зняттям обмежень, що стверджує про найсильніші у світі можливості кібербезпеки. Наразі вона доступна лише через Project Glasswing для кібербезпекових агентств, як оновлення з Mythos Preview. Anthropic планує поступово розширювати: вести переговори з урядом США щодо збільшення кількості партнерів; запускати більш систематичну програму довіреного доступу для кібербезпекових організацій; і відкривати довірений план для біологічних досліджень (знімаючи захист у біотехнології, але зберігаючи захист у кібербезпеці), щоб прискорити нові терапії. Цей "такий самий модель, розблокування за ідентичністю" підхід є першим у випусках frontier AI.
5. Ціноутворення та доступ: безкоштовний API до 22 червня
Ціноутворення API під час безкоштовного періоду: $10 за мільйон токенів для вводу, $50 за мільйон токенів для виводу — менше ніж у Mythos Preview. Ідентифікатор моделі — claude-fable-5, і API та платформи "оплата за використання" доступні вже сьогодні. Підписники мають врахувати:
◆ Зараз і до 22 червня: пакети Pro, Max, Team та корпоративні включають Fable 5 безкоштовно;
◆ З 23 червня: він буде вилучений із пакетів, і подальше використання вимагатиме купівлі кредитів; якщо є можливість, безкоштовний період може бути продовжений;
◆ Після цього: у міру збільшення обчислювальної потужності Anthropic планує знову інтегрувати Fable 5 у стандартні підписки. Іншими словами, наступні два тижні — найкращий час для безкоштовного досвіду найпотужнішої моделі, тож зацікавлені читачі мають скористатися можливістю.
6. Останні думки: "новий підхід" до можливостей і безпеки
Останні роки frontier лабораторії стикалися лише з двома варіантами "що робити, якщо модель надто сильна": затримати випуск або зменшити можливості. Anthropic пропонує третій варіант — повний випуск із динамічним захистом для публічної версії, зберігаючи повну версію для довірених інституцій.
Цей підхід не ідеальний: 5% хибних спрацьовувань можуть засмутити деяких професійних користувачів (особливо дослідників безпеки та біологів), і 30-денне збереження даних може викликати питання конфіденційності. Але він дозволяє "найпотужнішу можливість" не закривати за урядовими проектами, а вводити її у діалог у контрольованому режимі. Коли AI може виконати два місяці командної роботи за один день або самостійно проектувати кандидатні ліки, "як випустити" стає так само важливим, як і "що створювати". Спільні корені Fable і Mythos можуть закласти прецедент для майбутніх стратегій випуску моделей frontier.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено