Внутренний меморандум Tencent раскрыт: последняя модель Hy3 использовала код Claude на этапе постобучения

Согласно мониторингу Dongcha Beating, The Information сослалась на источники, знакомые с ситуацией, и внутреннюю записку Tencent, в которой говорится, что сотрудники Tencent использовали Claude Code компании Anthropic во время этапа постобучения при разработке модели Hy3, несмотря на то, что Anthropic явно запрещает коммерческое использование для китайских компаний по соображениям национальной безопасности. Hy3 — самая мощная на сегодняшний день крупная языковая модель Tencent, оснащенная архитектурой MoE с 295 миллиардами параметров, и разрабатывалась под руководством главного ученого по ИИ Яо Шунью, присоединившегося к Tencent в конце прошлого года. Во время этапа RLHF (обучение с подкреплением на основе человеческой обратной связи) Tencent организовала сотрудников в качестве человеческих оценщиков, а внутренняя записка предоставила инструкции по установке Claude Code с лимитом использования «тысячами токенов» на человека. Сотрудники Tencent не считали это дистилляцией (обучением более слабой модели на выходных данных более сильной модели). Их подход заключался в постановке одних и тех же программных вопросов двум анонимным моделям и проведении слепых оценок; одновременно они использовали Claude Code для генерации высококачественных поведенческих примеров в реальном времени в качестве справочных данных для фильтрации низкокачественных ответов. Сотрудники нескольких компаний, занимающихся ИИ, подтвердили, что использование ведущих моделей в отрасли в качестве эталонных ссылок во время постобучения — распространенная практика. Представитель Anthropic заявил, что команда безопасности компании «активно следит за атаками дистилляции и принимает немедленные меры при обнаружении», но прямо не прокомментировал использование Tencent Claude Code. Распространенный способ для китайских компаний и разработчиков получить доступ к Claude — через посредников или регистрацию с помощью не-китайских номеров телефонов или кредитных карт. В начале этого месяца Anthropic ужесточила требования к верификации, и некоторым пользователям пришлось предоставлять фотографии удостоверений личности, выданных государством, и личные фотографии.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить