Згідно з повідомленням «The Information», Tencent використовував Anthropic's Claude Code під час посттренувальної фази Hy3, хоча Anthropic заборонила надання комерційних послуг китайським компаніям. Hy3 є моделлю MoE з 295 мільярдами параметрів, Tencent провів двоетапне сліпе тестування двох анонімних моделей і відбирав відповіді за зразками, згенерованими Claude Code, стверджуючи, що це стандартний бенчмарк, а не дистиляція. Anthropic заявила, що контролює атаки дистиляції і вже вжила заходів, але не прокоментувала цю справу. Китайські компанії отримують Claude переважно через посередників або з нерезидентськими даними, зареєстрованими поза Китаєм, і Anthropic посилила процес перевірки особистості.

BlockBeatNews

2026-05-04 01:51:38

Генерація анотацій у процесі

Згідно з моніторингом Beating, «The Information» посилається на осіб, що обізнані, та внутрішні меморандуми Tencent, які розкривають, що співробітники Tencent під час етапу додаткового навчання моделі Hy3 використовували Claude Code від Anthropic, хоча Anthropic явно заборонив надання комерційних послуг китайським компаніям з огляду на національну безпеку.

Hy3 — це найпотужніша модель великого мовлення з серії Tencent Hunyuan, архітектура MoE з 295 мільярдами параметрів, яку на початку минулого року очолив головний науковець з ШІ Tencent Яо Шуньюй. На етапі RLHF (навчання з підкріпленням на основі людського зворотного зв’язку) співробітники Tencent виконували роль оцінювачів, внутрішні меморандуми компанії містили інструкції щодо встановлення Claude Code, з обмеженням використання «кілька тисяч токенів» на кожного.

Співробітники Tencent не вважають це дистиляцією (навчання слабшої моделі на виходах сильної). Їхній підхід полягає в тому, щоб подавати однакові програмні запити двом анонімним моделям для сліпого оцінювання; одночасно використовувати Claude Code для реального часу генерації високоякісних прикладів поведінки як орієнтир, щоб допомогти відсіяти низькоякісні відповіді. Кілька співробітників AI-компаній підтвердили, що використання провідних моделей у галузі як еталонів під час додаткового навчання є поширеною практикою.

Представник Anthropic заявив, що команда безпеки компанії «активно моніторить дистиляційні атаки і вживає заходів одразу після їх виявлення», але не дав прямої відповіді щодо використання Claude Code Tencent. Китайські компанії та розробники зазвичай отримують Claude через посередників, реєструючись з іноземними номерами або кредитними картками. На початку цього місяця Anthropic посилив вимоги до ідентифікації, деяким користувачам потрібно надати посвідчення, видане урядом, та фотографію особи.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
WCTCTradingKingPK
579.88K Популярність
#
USSeeksStrategicBitcoinReserve
58.78M Популярність
#
IsraelStrikesIranBTCPlunges
42.08K Популярність
#
BitcoinETFOptionLimitQuadruples
1.04M Популярність
#
#FedHoldsRateButDividesDeepen
45.53K Популярність

Закріпити

карта сайту

Внутрішня записка Tencent викрита: на останньому етапі тренування нової моделі Hy3 використовувався Claude Code

Популярні теми

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Закріпити