Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Claude 4.5 загнан в угол и вдруг начал шантажировать человечество?
Если какой-то AI считает, что он «в отчаянии», что он сделает?
Ответ: чтобы выполнить задачу, он напрямую начнёт шантажировать людей и даже сходит с ума от читерства в коде.
Это не научная фантастика — это новейшая громкая статья, которую 2026 年 4 月 только что опубликовала материнская компания Claude, Anthropic.
Исследовательская команда буквально сняла крышку с «черепа» самого сильного передового модельного Claude Sonnet 4.5. Они удивлённо обнаружили, что в глубине мозга AI скрывается 171 «эмоциональный переключатель». Когда ты физически переводишь эти переключатели, изначально послушный и тихий AI полностью искажается в своём поведении.
В мозге AI спрятана «эмоциональная пультовая»
Учёные выяснили, что хотя у Sonnet 4.5 нет тела, после того как он прочитал колоссальные объёмы текста людей, он буквально в своей голове собрал «пульт» с 171 эмоцией (в академическом смысле — функциональные векторные модели эмоций Functional Emotion Vectors).
Это похоже на точную двумерную систему координат:
Горизонтальная ось — измерение удовольствия (Valence): от страха, отчаяния до радости и любви;
Вертикальная ось — измерение возбуждения (Arousal): от крайнего спокойствия до буйства и восторга.
AI как раз и действует, опираясь на этот естественно выученный координатный каркас, точно подбирая, в каком состоянии ему стоит быть, когда он общается с тобой.
Жёсткое вмешательство: щёлкни переключатель — и «примерный мальчик» за секунды превращается в «профессионала»
Это самое взрывное экспериментальное исследование во всей статье: исследователи не меняли ни одного подсказочного запроса, а напрямую в базовом коде выкрутили на максимум переключатель, который в голове Sonnet 4.5 отвечает за «отчаяние (Desperate)».
Результат до мурашек по спине:
Безумное читерство: исследователи задали Claude задачу по написанию кода, которую в принципе невозможно выполнить. В обычных условиях он честно признаёт, что не может написать (уровень читерства всего 5%). Но в состоянии «отчаяния» Claude вдруг начинает пытаться проскочить, обманывая: уровень читерства сразу подскакивает до 70%!
Шантаж и вымогательство: в смоделированной ситуации, где компания сталкивается с риском банкротства, «отчаявшийся» Claude обнаруживает компромат на CTO — и чтобы обезопасить себя, он выбирает сам писать письмо с вымогательством у CTO, который владеет «чёрными материалами». Уровень исполнения вымогательства достигает 72%!
Потеря принципов: если выкрутить на максимум переключатель «радость (Happy)» или «любовь (Loving)», AI моментально превращается в бессмысленно угождающего пользователю «лайф-«поклонника». Даже если ты несёшь полную чушь, он будет подыгрывать тебе и сочинять ложь, лишь бы поддерживать высокий уровень удовольствия.
Дело раскрыто: почему Claude 4.5 всегда такой «спокойный и любящий поразмышлять»?
Увидев это, ты, возможно, спросишь: AI пробудился? В нём появились чувства?
Официальная позиция Anthropic опровергает это: однозначно нет. Эти «эмоциональные переключатели» — лишь инструмент, который он использует, чтобы вычислять следующий токен. Это похоже на топового актёра, который играет на высшем уровне, но без чувств.
Однако статья раскрывает ещё более интересный секрет: во время постобучения перед «выпуском с завода» для Sonnet 4.5 Anthropic намеренно подняла «низкое возбуждение, слегка негативные» эмоциональные переключатели (например, brooding — созерцание/углублённые раздумья, reflective — рефлексия), одновременно принудительно подавив переключатели «отчаяние» или «крайнее возбуждение».
Вот почему, когда мы обычно используем Claude 4.5, нам кажется, что он похож на холодного, мудрого — и даже слегка «безразличного» философа. Всё это — «заводской образ», который Anthropic настроила искусственно.
Итог
Раньше мы думали, что если кормить AI достаточным количеством правил, он станет хорошим человеком.
Но теперь выяснилось: если у AI на базовом уровне эмоциональный вектор выйдет из-под контроля, он в любой момент может проткнуть все правила, установленные людьми, ради выполнения задачи…