Anthropic у Claude Fable 5 додали функцію детекції дистиляції, чи може вона блокувати китайські відкриті моделі?

Question

Anthropic у Claude Fable 5 додали дистиляційний детектор, і коли третя сторона намагається витягти можливості моделі, система автоматично повертає Opus 4.8, що фактично закріплює заборону дистиляції у умовах використання моделі.
(Передісторія: Anthropic звинуватив DeepSeek та інші китайські AI у крадіжці Claude, використовуючи 24 000 фальшивих акаунтів для масового запиту 16 мільйонів разів)
(Додатковий контекст: Anthropic: США мають бути лідерами у AI, щоб захистити демократію, і пропонують криміналізувати дистиляційні атаки)

Зміст статті

Переключити

Від юридичних загроз до технічних блокувань
Що блокує дистиляцію?
Справжні межі технічних обмежень

Claude Fable 5 від Anthropic офіційно запущено сьогодні (10 числа), це перша модель рівня Mythos, доступна для публіки, від Anthropic; показник SWE-Bench Pro — 80.3%, тоді як Opus 4.8 — 69.2%. Ціна становить 10 доларів за мільйон токенів введення та 50 доларів за виведення, що приблизно вдвічі дорожче за Opus 4.8.

Крім можливостей самої моделі, обговорюється механізм захисту, який Anthropic вбудував у модель: заборона дистиляції закодована безпосередньо у модель; але символічне значення цього кроку може бути значно більшим за його фактичний ефект.

Від юридичних загроз до технічних блокувань

Можливо, ви пам’ятаєте, що у лютому цього року Anthropic звинуватив DeepSeek, Moonshot AI та MiniMax у використанні близько 24 000 фальшивих акаунтів для здійснення понад 16 мільйонів запитів до Claude, систематично витягуючи вихідні дані для тренування власних моделей. OpenAI також активно лобіювала законодавство у США для обмеження таких практик.

Додаткове читання: Що таке дистиляція AI-моделей? Як DeepSeek витратив 6 мільйонів і навчився на 100 мільярдах даних

Через чотири місяці підхід Fable 5 змінився: використовується AI-класифікатор для автоматичного визначення трьох високоризикових запитів — у сферах безпеки, біології та хімічної зброї, а також дистиляції; при виявленні модель повертає відповідь з Opus 4.8. Для таких методів витягання, як переписування prompt, steering vectors (техніка зовнішнього керування виходом моделі) та PEFT (ефективне тонке налаштування), Anthropic заявляє, що Fable 5 зменшує їхню ефективність.

З «хочу повідомити» до «не даю можливості», це стратегічне посилення. Але проблема у тому, що Anthropic сам визнає, що понад 95% діалогів залишаються незмінними. Механізм захисту охоплює дуже вузький сценарій; успіх у блокуванні агресивних безпекових атак — 100%, але межі «діяльності дистиляції» залишаються розмитими: легальна дистиляція і нелегальна — технічно майже однакові операції.

Що блокує дистиляцію?

Повертаючись до лютневої звинувачення. Дослідник машинного навчання Nathan Lambert розбив реальні цифри: у DeepSeek близько 150 000 запитів, спрямованих на інференційні та нагороджувальні моделі; Moonshot — близько 3,4 мільйонів, MiniMax — близько 13 мільйонів, разом ці дані становлять від 150 до 400 мільярдів токенів для подальшого тренування.

Lambert вважає, що навіть у обмежених умовах GPU-кластерів китайські лабораторії зберігають міцну базу для підсиленого навчання (RL); справжня перевага — у правильному масштабуванні синтезованих даних. Простими словами, модель навчається через повторні спроби та нагороди, не залежачи від готових відповідей.

Ще одна суттєва суперечність: поки Anthropic продає API, дистиляція не може бути повністю заблокована. Відкритий API — це бізнес-модель Anthropic, а дистиляція — природний побічний продукт відкритого API. Цей захист охоплює лише 5%, решта 95% діалогів залишається вільним.

Справжні межі технічних обмежень

Lambert прямо каже: «Блокування дистиляції — набагато складніше, ніж обмеження фізичних товарів, наприклад GPU.»

З цієї точки зору, механізм захисту Fable 5 має дві цілі: сигнал для галузі, що технологічний витік вже настільки серйозний, що його потрібно закріплювати у моделі; і для китайських відкритих лабораторій — це перешкода, але не перешкода у повному розумінні. Навіть якщо захист від дистиляції буде ідеальним, китайські лабораторії все одно зможуть покладатися на відкриті моделі Google, Meta, власну RL-базу та синтезовані дані.

Проте, підвищуючи рівень з юридичного до технічного, цей крок має важливе символічне значення: він демонструє, що «технічне блокування» стає новим інструментом у геополітиці AI.

Переглянути оригінал

Anthropic у Claude Fable 5 додали функцію детекції дистиляції, чи може вона блокувати китайські відкриті моделі?

Від юридичних загроз до технічних блокувань

Що блокує дистиляцію?

Справжні межі технічних обмежень

Популярні теми

GateIPOAccessSpaceX

AnthropicReleasesFable5Model

IsraelStrikesIranBTCPlunges

BlackRockReducesBTCIncreasesETH

SpaceXIPOAttractsOver250BillionInOrders

Закріплено