9 июня Anthropic одновременно выпустила две новые модели — Claude Fable 5 и Claude Mythos 5. Интересно, что они фактически основаны на одной и той же базовой модели, единственное отличие — степень «защиты безопасности». Это первый раз, когда самая мощная модель Anthropic стала доступна публике, и это также редкий эксперимент с «слоистым выпуском».
Эта статья поможет вам понять: что делает её мощной, почему у неё два названия и как использовать её сейчас.
1. Сначала уточним: что такое модель уровня «Mythos»?
Знакомы с Claude? Читатели знают, что модели Anthropic всегда делятся на три уровня: Haiku (быстрая), Sonnet (сбалансированная), Opus (самая мощная). В апреле этого года Anthropic тихо ввела новый уровень выше Opus — уровень Mythos. Первая модель уровня Mythos (Claude Mythos Preview) не продавалась публично, а была выпущена через проект Project Glasswing, в сотрудничестве с правительством США, и была доступна только для избранных кибербезопасных агентств и поставщиков критической инфраструктуры.
Причина проста: этот уровень модели слишком мощный, его можно неправомерно использовать в таких областях, как кибератаки и биологические исследования, поэтому Anthropic считает, что его не следует выпускать напрямую.
Две модели, выпущенные в этот раз, — это официальные версии уровня Mythos:
◆ Claude Fable 5: версия для всех с новым набором средств защиты;
◆ Claude Mythos 5: версия с частичным снятием ограничений, доступная только доверенным партнёрам, таким как Glasswing. Обе основаны на одной и той же основной модели. Названия также тщательно выбраны: Fable происходит от латинского fabula («рассказ, история»), и имеет корни в греческом mythos — происхождение одинаковое, различие только в «способности свободно говорить».
2. Насколько она мощная?
По словам Anthropic, Fable 5 превосходит любую модель, которую компания когда-либо публиковала, и является передовой (SOTA) почти по всем бенчмаркам ИИ, особенно хорошо проявляя себя в программной инженерии, интеллектуальной работе, визуальном понимании и научных исследованиях. Чем длиннее и сложнее задача, тем больше её преимущество перед старыми моделями.
Кодирование: сжатие двух месяцев в один день. Компания Stripe, занимающаяся платежами, в ранних тестах сообщила, что Fable 5 завершила полную миграцию Ruby-кода объемом 50 миллионов строк за один день — то, что обычно занимает команде более двух месяцев ручной работы. В оценке Cognition (разработчика Devin) FrontierCode Fable 5 набрала наивысшие баллы среди современных моделей и использовала меньше токенов.
Визуальное восприятие: прохождение Pokémon FireRed без помощи. Предыдущие модели Claude требовали сложных вспомогательных инструментов (карты, навигация, информация о состоянии игры), чтобы еле продвинуться в Pokémon, но Fable 5 прошла игру просто, глядя на исходный экран. Она также может восстанавливать исходный код веб-приложения прямо по скриншотам.
Память: ведение заметок во время игры в Slay the Spire. В задачах с миллионами токенов Fable 5 может сохранять концентрацию и повышать производительность, используя собственные заметки. В тестах с карточной игрой Slay the Spire, после получения постоянной памяти, её производительность увеличилась в три раза по сравнению с Opus 4.8.
Научные исследования: ускорение разработки лекарств примерно в 10 раз. Внутренние эксперты по проектированию белков в Anthropic использовали Mythos 5 для ускорения некоторых этапов разработки лекарств примерно в десять раз — модели независимо выполняли задачи, такие как выбор участков связывания, запуск инструментов проектирования белков и восстановление после сбоев, всё без помощи человека. Из 14 целей белков 9 дали перспективные кандидатные лекарства для дальнейшей разработки. Также она предложила новую механистическую гипотезу о белках E. coli, которая позже была подтверждена независимой исследовательской лабораторией.
3. Как работает защита безопасности: вызывает «понижение» до Opus 4.8
Это самый интригующий аспект выпуска. Fable 5 оснащена новым набором классификаторов — системы ИИ, отделённой от основной модели, предназначенной для обнаружения потенциальных злоупотреблений. Когда классификатор обнаруживает, что ваш запрос связан с одной из трёх чувствительных областей, ответ больше не поступает от Fable 5, а автоматически переключается на менее мощную модель — Claude Opus 4.8 (с уведомлением пользователя):
1. Кибербезопасность: модели Mythos уровня очень хорошо умеют обнаруживать и эксплуатировать уязвимости программного обеспечения, а также могут выполнять «автономное взлом» — разведку и латеральное перемещение в одном пакете. Эти возможности значительно снижают стоимость кибератак, поэтому основной акцент делается на защиту.
2. Биология и химия: модель теперь может выполнять реальные научные задачи (например, предсказание сборки вирусных капсидов). Такие двойные возможности опасны в злонамеренных руках, поэтому большинство запросов в биотехнологии понижены до Opus.
3. Атаки на дистилляцию: предотвращение масштабного «выкачивания» возможностей Fable 5 для обучения конкурирующих моделей.
Ключевые показатели: защита срабатывает менее чем в 5% сессий, то есть более 95% пользователей получают почти полный функционал Mythos 5. Anthropic признаёт, что защита настроена консервативно и может давать ложные срабатывания, и планирует скоро снизить количество ложных срабатываний. Что касается jailbreak-атак, более 1000 часов внешнего тестирования с помощью программ по поиску уязвимостей не выявили «универсальных джейлбрейков».
Ещё одно заметное изменение: весь трафик с моделей уровня Mythos будет сохраняться в течение 30 дней (включая корпоративных клиентов) для защиты от новых методов атак и jailbreak-атак — Anthropic обещает, что эти данные не будут использоваться для обучения и что есть меры конфиденциальности, такие как аудит доступа.
4. Mythos 5: версия «доверенного круга» без ограничений
Mythos 5 — по сути, Fable 5 с частичным снятием ограничений, заявляя о самых сильных в мире возможностях кибербезопасности. В настоящее время она доступна только через Project Glasswing для кибербезопасных агентств, как обновление от Mythos Preview. Anthropic планирует постепенно расширять: вести переговоры с правительством США о расширении числа партнёров; запуск более систематизированной программы доверенного доступа для кибербезопасных организаций; и открыть доверенный план для биологических исследований (с удалением биотехнологических ограничений, но сохранением кибербезопасных), чтобы ускорить разработку новых терапий. Этот «одинаковая модель, ступенчатое разблокирование по идентичности» — первый такой подход в выпуске передовых ИИ.
5. Цены и доступ: бесплатный API до 22 июня
Стоимость API в течение бесплатного периода: 10 долларов за миллион токенов для ввода, 50 долларов за миллион токенов для вывода — менее половины Mythos Preview. Идентификатор модели — claude-fable-5, API и платные планы для предприятий доступны уже сегодня. Обратите внимание подписчики:
◆ С сегодняшнего дня до 22 июня: пакеты Pro, Max, Team и корпоративные включают Fable 5 бесплатно;
◆ С 23 июня: он будет исключён из пакетов, и дальнейшее использование потребует покупки кредитов; при наличии свободных ресурсов бесплатный период может быть продлён;
◆ После этого: по мере увеличения вычислительных мощностей Anthropic планирует вновь интегрировать Fable 5 в стандартные подписки. Другими словами, следующие две недели — лучшее время, чтобы бесплатно опробовать самую мощную модель, поэтому не упустите шанс.
6. Итоговые мысли: «новый подход» к возможностям и безопасности
В последние годы передовые лаборатории сталкивались только с двумя вариантами «что если модель слишком сильна»: задержка выпуска или сокращение возможностей. Anthropic предлагает третье решение — полный выпуск с динамическими средствами защиты для публичной версии, при этом полная версия остаётся у доверенных институтов.
Этот подход не идеален: 5% ложных срабатываний могут разочаровать некоторых профессиональных пользователей (особенно исследователей безопасности и биологов), а хранение данных в течение 30 дней может вызвать опасения по поводу конфиденциальности. Но он позволяет «самой мощной возможностью» не быть заблокированной за государственными проектами, а входить в диалог с каждым в контролируемом режиме. Когда ИИ может выполнить двухмесячную работу команды за один день или независимо разработать кандидатные лекарства, «как выпускать» становится так же важно, как «что создавать». Общие корни Fable и Mythos могут задать прецедент для будущих стратегий выпуска передовых моделей.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
GateIPOAccessSpaceX
5.3M Популярность
#
AnthropicReleasesFable5Model
647.64K Популярность
#
IsraelStrikesIranBTCPlunges
57.11K Популярность
#
MyGateTradeStory
18.68K Популярность
#
SpaceXIPOAttractsOver250BillionInOrders
1.41M Популярность

Закреплено

Карта сайта

#Anthropic发布Fable5模型 Модель, два названия: Anthropic выпускает Fable 5 и Mythos 5, самые мощные модели, доступные публике впервые

Популярные темы

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

MyGateTradeStory

SpaceXIPOAttractsOver250BillionInOrders

Закреплено