Anthropic у Claude Fable 5 додали функцію детекції дистиляції, чи може вона блокувати китайські відкриті моделі?

Anthropic у Claude Fable 5 додали дистиляційний детектор, і коли третя сторона намагається витягти можливості моделі, система автоматично повертає Opus 4.8, що фактично закріплює заборону дистиляції у умовах використання моделі.
(Передісторія: Anthropic звинуватив DeepSeek та інші китайські AI у крадіжці Claude, використовуючи 24 000 фальшивих акаунтів для масового запиту 16 мільйонів разів)
(Додатковий контекст: Anthropic: США мають бути лідерами у AI, щоб захистити демократію, і пропонують криміналізувати дистиляційні атаки)

Зміст статті

Переключити

  • Від юридичних загроз до технічних блокувань
  • Що блокує дистиляцію?
  • Справжні межі технічних обмежень

Claude Fable 5 від Anthropic офіційно запущено сьогодні (10 числа), це перша модель рівня Mythos, доступна для публіки, від Anthropic; показник SWE-Bench Pro — 80.3%, тоді як Opus 4.8 — 69.2%. Ціна становить 10 доларів за мільйон токенів введення та 50 доларів за виведення, що приблизно вдвічі дорожче за Opus 4.8.

Крім можливостей самої моделі, обговорюється механізм захисту, який Anthropic вбудував у модель: заборона дистиляції закодована безпосередньо у модель; але символічне значення цього кроку може бути значно більшим за його фактичний ефект.

Від юридичних загроз до технічних блокувань

Можливо, ви пам’ятаєте, що у лютому цього року Anthropic звинуватив DeepSeek, Moonshot AI та MiniMax у використанні близько 24 000 фальшивих акаунтів для здійснення понад 16 мільйонів запитів до Claude, систематично витягуючи вихідні дані для тренування власних моделей. OpenAI також активно лобіювала законодавство у США для обмеження таких практик.

Додаткове читання: Що таке дистиляція AI-моделей? Як DeepSeek витратив 6 мільйонів і навчився на 100 мільярдах даних

Через чотири місяці підхід Fable 5 змінився: використовується AI-класифікатор для автоматичного визначення трьох високоризикових запитів — у сферах безпеки, біології та хімічної зброї, а також дистиляції; при виявленні модель повертає відповідь з Opus 4.8. Для таких методів витягання, як переписування prompt, steering vectors (техніка зовнішнього керування виходом моделі) та PEFT (ефективне тонке налаштування), Anthropic заявляє, що Fable 5 зменшує їхню ефективність.

З «хочу повідомити» до «не даю можливості», це стратегічне посилення. Але проблема у тому, що Anthropic сам визнає, що понад 95% діалогів залишаються незмінними. Механізм захисту охоплює дуже вузький сценарій; успіх у блокуванні агресивних безпекових атак — 100%, але межі «діяльності дистиляції» залишаються розмитими: легальна дистиляція і нелегальна — технічно майже однакові операції.

Що блокує дистиляцію?

Повертаючись до лютневої звинувачення. Дослідник машинного навчання Nathan Lambert розбив реальні цифри: у DeepSeek близько 150 000 запитів, спрямованих на інференційні та нагороджувальні моделі; Moonshot — близько 3,4 мільйонів, MiniMax — близько 13 мільйонів, разом ці дані становлять від 150 до 400 мільярдів токенів для подальшого тренування.

Lambert вважає, що навіть у обмежених умовах GPU-кластерів китайські лабораторії зберігають міцну базу для підсиленого навчання (RL); справжня перевага — у правильному масштабуванні синтезованих даних. Простими словами, модель навчається через повторні спроби та нагороди, не залежачи від готових відповідей.

Ще одна суттєва суперечність: поки Anthropic продає API, дистиляція не може бути повністю заблокована. Відкритий API — це бізнес-модель Anthropic, а дистиляція — природний побічний продукт відкритого API. Цей захист охоплює лише 5%, решта 95% діалогів залишається вільним.

Справжні межі технічних обмежень

Lambert прямо каже: «Блокування дистиляції — набагато складніше, ніж обмеження фізичних товарів, наприклад GPU.»

З цієї точки зору, механізм захисту Fable 5 має дві цілі: сигнал для галузі, що технологічний витік вже настільки серйозний, що його потрібно закріплювати у моделі; і для китайських відкритих лабораторій — це перешкода, але не перешкода у повному розумінні. Навіть якщо захист від дистиляції буде ідеальним, китайські лабораторії все одно зможуть покладатися на відкриті моделі Google, Meta, власну RL-базу та синтезовані дані.

Проте, підвищуючи рівень з юридичного до технічного, цей крок має важливе символічне значення: він демонструє, що «технічне блокування» стає новим інструментом у геополітиці AI.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено