Сегодня Anthropic выпустила свою самую опасную модель


Так сказать. Модель называется Mythos, и она настолько хорошо умеет находить и взламывать программное обеспечение, что Anthropic потратила 2 месяца, позволяя киберзащитникам и инфраструктурным компаниям работать только с ней.
То, что вы получаете сегодня, — это Fable 5, та же модель с фильтром, который блокирует вопросы по кибербезопасности, биологии и химии и передает их более слабой модели.
Однако этот фильтр активируется только в менее чем 5% сессий. Так что 95% времени вы общаетесь с тем, что они считали слишком опасным для распространения.
Команда Anthropic по безопасности потратила 1000 часов, пытаясь сломать защитные механизмы, и не смогла.
Но у интернета гораздо больше, чем 1000 часов, и гораздо более веская причина пытаться. Каждая заблокированная модель в истории была взломана, обычно в течение нескольких дней.
Эти предстоящие недели покажут многое.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено