Внутрішня записка Tencent викрита: на останньому етапі тренування нової моделі Hy3 використовувався Claude Code

robot
Генерація анотацій у процесі

Згідно з моніторингом Beating, «The Information» посилається на осіб, що обізнані, та внутрішні меморандуми Tencent, які розкривають, що співробітники Tencent під час етапу додаткового навчання моделі Hy3 використовували Claude Code від Anthropic, хоча Anthropic явно заборонив надання комерційних послуг китайським компаніям з огляду на національну безпеку.

Hy3 — це найпотужніша модель великого мовлення з серії Tencent Hunyuan, архітектура MoE з 295 мільярдами параметрів, яку на початку минулого року очолив головний науковець з ШІ Tencent Яо Шуньюй. На етапі RLHF (навчання з підкріпленням на основі людського зворотного зв’язку) співробітники Tencent виконували роль оцінювачів, внутрішні меморандуми компанії містили інструкції щодо встановлення Claude Code, з обмеженням використання «кілька тисяч токенів» на кожного.

Співробітники Tencent не вважають це дистиляцією (навчання слабшої моделі на виходах сильної). Їхній підхід полягає в тому, щоб подавати однакові програмні запити двом анонімним моделям для сліпого оцінювання; одночасно використовувати Claude Code для реального часу генерації високоякісних прикладів поведінки як орієнтир, щоб допомогти відсіяти низькоякісні відповіді. Кілька співробітників AI-компаній підтвердили, що використання провідних моделей у галузі як еталонів під час додаткового навчання є поширеною практикою.

Представник Anthropic заявив, що команда безпеки компанії «активно моніторить дистиляційні атаки і вживає заходів одразу після їх виявлення», але не дав прямої відповіді щодо використання Claude Code Tencent. Китайські компанії та розробники зазвичай отримують Claude через посередників, реєструючись з іноземними номерами або кредитними картками. На початку цього місяця Anthropic посилив вимоги до ідентифікації, деяким користувачам потрібно надати посвідчення, видане урядом, та фотографію особи.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити