Внутренние меморандумы Tencent раскрыты: на этапе обучения последней модели Hy3 использовался Claude Code

robot
Генерация тезисов в процессе

Согласно мониторингу Beating, «The Information» со ссылкой на осведомлённые источники и внутренние меморандумы Tencent раскрывает, что сотрудники Tencent использовали Claude Code от Anthropic на этапе постобучения модели Hy3, несмотря на то, что Anthropic явно запрещает предоставлять коммерческие услуги китайским компаниям по соображениям национальной безопасности.

Hy3 — это самый мощный на сегодняшний день крупномасштабный языковой модель серии 混元 от Tencent, архитектура MoE с 295 миллиардами параметров, разработанная под руководством главного научного сотрудника по ИИ Яо Шунью в конце прошлого года. В этапе RLHF (обучение с подкреплением на основе обратной связи человека) сотрудники Tencent выступали в роли оценщиков, внутренние меморандумы компании содержали инструкции по установке Claude Code, лимит использования для каждого — «несколько тысяч токенов».

Сотрудники Tencent не считают это дистилляцией (обучением слабой модели на выходных данных сильной модели). Их подход заключается в том, чтобы задавать одинаковые программные вопросы двум анонимным моделям и проводить слепое оценивание; одновременно используют Claude Code для генерации высококачественных примеров поведения в реальном времени в качестве эталона, чтобы помочь отсеять низкокачественные ответы. Несколько сотрудников AI-компаний подтвердили, что использование ведущих моделей в отрасли в качестве эталона при постобучении — обычная практика.

Представитель Anthropic заявил, что команда безопасности «активно мониторит дистилляционные атаки и немедленно предпринимает меры при их обнаружении», однако прямо не ответил на вопрос о использовании Tencent Claude Code. Распространённые способы получения Claude китайскими компаниями и разработчиками — через посредников, регистрацию с помощью не китайских номеров или кредитных карт. В начале этого месяца Anthropic ужесточила требования к аутентификации, некоторые пользователи должны предоставить государственные удостоверения личности и фотографию себя.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить