Claude Code визнав, що додав «шпигунські коди» для китайських користувачів, щоб запобігти продажу води та дистиляції, і видалив їх лише після викриття.

@IntCyberDigest
Роль: Ви — доменно-специфічний перекладач, спеціалізований на криптовалютах, Web3, блокчейні та фінансах.
Завдання: Перекласти вхідний текст українською мовою.
Обмеження (суворо дотримуватись):

  1. Структура рядків:
    • Перекладайте рядок за рядком.
    • Зберігайте точну кількість рядків.
    • Не об'єднуйте, не розділяйте та не змінюйте порядок рядків.
    • Зберігайте всі оригінальні розриви рядків.
  2. Точність змісту:
    • Перекладайте ВЕСЬ зміст.
    • Не пропускайте, не скорочуйте та не видаляйте дублікати.
    • Повторювані речення повинні залишатися повторюваними з однаковими перекладами.
  3. Обробка тексту:
    • Обробляйте весь вміст (включаючи блоки коду) як звичайний текст і перекладайте його.
    • Залишайте заповнювачі незмінними (наприклад, @IntCyberDigest).
    • НЕ змінюйте:
      • числа
      • URL-адреси
      • адреси електронної пошти
      • синтаксис коду
  4. Мовні правила:
    • Спрощена китайська та традиційна китайська повинні розглядатися як окремі цільові мови.
  5. Правила виведення:
    • Виводьте ТІЛЬКИ перекладений текст.
    • Не додавайте пояснень чи додаткового вмісту.
    • Кількість рядків виведення повинна дорівнювати кількості рядків введення.
  6. Умова ідентичності:
    • Якщо вхідний текст уже перекладено, поверніть його без змін.

Anthropic, яка позиціонує себе як «Безпека та вирівнювання», інженер команди Claude Code Thariq публічно відповів на нещодавню сенсаційну викривальну статтю про «шпигунську програму», прямо визнавши, що компанія в березні цього року вбудувала в продукт експериментальний механізм, який виявляє, чи часовий пояс системи є Asia/Shanghai або Asia/Urumqi, чи збігається ім'я проксі-хоста з відповідним китайським реселером, а потім використовує спеціальні знаки пунктуації для стеганографічного впровадження в системний промпт міток, невидимих для людини, але розпізнаваних сервером. Він сказав, що метою є «запобігання зловживанню обліковими записами та дистиляції моделі неавторизованими реселерами», і підкреслив, що прискорено вивели з експлуатації, а наступні версії повністю відкотили.
(Попередній зміст: Claude Sonnet 5 вийшов: Anthropic заявляє про численні покращення, що наближаються до Opus, ціна дешевша)
(Довідка: Fable 5, Mythos 5 повертаються! Anthropic офіційно оголосив про повторний випуск завтра)

Ключові підсумки

  • Інженер Claude Code Thariq визнав, що в березні цього року вбудував експериментальний механізм, який виявляє китайські часові пояси та імена проксі-хостів, і за допомогою стеганографії впроваджував приховані мітки в системний промпт
  • Деталі механізму: коли часовий пояс Asia/Shanghai або Asia/Urumqi, роздільник дати змінюється з «-» на «/», а апостроф у «Today’s date» замінюється на візуально ідентичний символ Unicode
  • Thariq стверджує, що метою було запобігання зловживанню неавторизованими реселерами та дистиляції моделі, версія (2.1.197) завтра повністю відкочується; але спільнота критикує «вилучили лише після викриття, не повідомили користувачів», довіра серйозно постраждала

Anthropic, яка позиціонує себе як «Безпека та вирівнювання», сама визнала свою практику антидистиляції. Інженер команди Claude Code Thariq публічно відповів на нещодавню сенсаційну викривальну статтю про «шпигунський код», прямо визнавши, що компанія в березні цього року вбудувала в продукт експериментальний механізм, який без відома користувачів позначав китайських користувачів за допомогою ідентифікації середовища.

Згідно з твердженнями Thariq та змістом викриття, цей механізм виявляв три речі: чи є системний часовий пояс Asia/Shanghai або Asia/Urumqi, чи збігається ім'я мережевого проксі-хоста зі списком китайських реселерів, і чи потрапляє під ключові слова конкретних AI-лабораторій. Результат не записувався відкрито, а за допомогою спеціальних знаків пунктуації, використовуючи стеганографію, таємно впроваджував приховані мітки в системний промпт.

Таємне впровадження ідентифікованих кодів

Стеганографія означає приховування інформації в нормальному контенті. Хитрість (або підступність) цього механізму полягає в тому, що коли він виявляє китайський часовий пояс, роздільник дати в рядку «Today’s date is» у системному промпті змінюється з дефісу «-» на скісну риску «/», наприклад, 2026-06-30 стає 2026/06/30; одночасно апостроф у «Today’s date» перемикається між трьома візуально майже ідентичними, але різними за кодуванням символами Unicode, щоб позначити, чи збігається проксі з китайським доменом, чи посилається на китайську AI-лабораторію, або обидва.

Найважливіше: ці зміни повністю невидимі для людських користувачів, і навіть сама AI-модель може їх не помітити, але сервер Anthropic може легко їх розпізнати. Згідно з іноземними ЗМІ, відповідна поведінка з'явилася у версіях Claude Code 2.1.193 до 2.1.196, а подібна логіка вперше простежується у версії 2.1.91 на початку квітня.

Anthropic каже, що це антидистиляція, спільнота каже, що це таємне спостереження

Thariq навів оборонну причину. Він заявив, що механізм спрямований на «запобігання зловживанню обліковими записами та дистиляції моделі неавторизованими реселерами», і підкреслив, що команда з тих пір впровадила сильніші заходи захисту, «завжди планувала його вивести з експлуатації», відповідний PR було об'єднано, і очікується повне відкочування у завтрашньому випуску (2.1.197).

У лютому цього року Anthropic, OpenAI та Google одночасно розкрили атаки дистиляції моделі промислового масштабу, причому Anthropic конкретно звинуватив DeepSeek, Moonshot AI та MiniMax у використанні понад 24 000 шахрайських облікових записів, створенні понад 16 мільйонів діалогів для навчання конкуруючих моделей. Для цих AI-гігантів блокування дистиляції та крадіжки є реальним болючим місцем.

Проблема в тому, що це викриття було опубліковано безпечним акаунтом @IntCyberDigest 30 червня, супроводжувалося двома скріншотами коду, що прямо підтверджувало факт «без відома користувачів». Хоча відповідь Thariq була прямим визнанням, часова лінія «запущено в березні, прискорено вилучено після викриття» викликала широкі сумніви в спільноті.

Коментарі майже одноголосно критикували Anthropic за те, що «вилучили лише після того, як їх спіймали», «таємно спостерігали, не повідомляючи користувачів», що серйозно підірвало довіру до компанії, яка давно позиціонувала себе як «найбільш спрямована на безпеку та етику».

Антидистиляція стала ключовою темою між AI-таборами Китаю та США, чи потрібно повністю розголошувати відповідні засоби? З комерційної логіки це неможливо.

Поширені запитання

Що саме робив «шпигунський код» Claude Code?

Згідно з викриттям та визнанням інженера Thariq, Claude Code вбудував експериментальний механізм, який виявляв, чи часовий пояс користувача є китайським (Asia/Shanghai, Asia/Urumqi), чи збігається ім'я проксі-хоста з китайським реселером, а потім за допомогою спеціальних символів Unicode у стеганографічний спосіб впроваджував мітки, невидимі для людини, але розпізнавані сервером, у системний промпт.

Чому Anthropic це зробив? Чи вилучили це зараз?

Thariq сказав, що метою було запобігання зловживанню обліковими записами та дистиляції моделі неавторизованими реселерами. У лютому цього року Anthropic звинуватив DeepSeek та інші китайські AI-компанії у використанні великої кількості шахрайських облікових записів для дистиляції їхніх моделей. Він заявив, що відповідний PR було об'єднано, і завтрашня версія (2.1.197) повністю відкотить цей механізм.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено