Так сказать. Модель называется Mythos, и она настолько хорошо умеет находить и взламывать программное обеспечение, что Anthropic потратила 2 месяца, позволяя киберзащитникам и инфраструктурным компаниям работать только с ней.
То, что вы получаете сегодня, — это Fable 5, та же модель с фильтром, который блокирует вопросы по кибербезопасности, биологии и химии и передает их более слабой модели.
Однако этот фильтр активируется только в менее чем 5% сессий. Так что 95% времени вы общаетесь с тем, что они считали слишком опасным для распространения.
Команда Anthropic по безопасности потратила 1000 часов, пытаясь сломать защитные механизмы, и не смогла.
Но у интернета гораздо больше, чем 1000 часов, и гораздо более веская причина пытаться. Каждая заблокированная модель в истории была взломана, обычно в течение нескольких дней.
Эти предстоящие недели покажут многое.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
MyGateTradeStory
269,71K Популярность
#
TradFiCFDGoldMaster
2M Популярность
#
IsraelStrikesIranBTCPlunges
57,92K Популярность
#
PredictWorldCup🇺🇸vs🇵🇾
761,81K Популярность
#
USIranPeaceDealReachedStraitOfHormuzToOpen
2,27M Популярность

Закреплено

Карта сайта

Сегодня Anthropic выпустила свою самую опасную модель

Популярные темы

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

USIranPeaceDealReachedStraitOfHormuzToOpen

Закреплено