Memorando interno da Tencent divulgado: o último modelo Hy3 usou Claude Code na fase pós-treinamento

robot
Geração de resumo em curso

De acordo com o monitoramento Beating, o jornal 《The Information》 citou fontes familiarizadas e um memorando interno da Tencent que revelou que funcionários da Tencent usaram o Claude Code da Anthropic na fase de pós-treinamento do desenvolvimento do modelo Hy3, apesar de a Anthropic ter proibido explicitamente fornecer serviços comerciais a empresas chinesas por motivos de segurança nacional.

Hy3 é o modelo de linguagem mais avançado da série Mengyuan da Tencent até agora, com arquitetura MoE de 295 bilhões de parâmetros, liderado pelo principal cientista de IA da Tencent, Yao Shunyu, no final do ano passado. Na fase de RLHF (aprendizado por reforço com feedback humano), a Tencent organizou funcionários para atuarem como avaliadores humanos, e um memorando interno forneceu orientações para a instalação do Claude Code, com limite de uso de “alguns milhares de tokens” por pessoa.

Os funcionários da Tencent não consideram isso como destilação (treinar um modelo fraco com a saída de um modelo forte). Sua abordagem foi: apresentar o mesmo problema de programação a dois modelos anônimos, fazer avaliações cegas; ao mesmo tempo, usar o Claude Code para gerar exemplos de comportamento de alta qualidade em tempo real como referência, ajudando a filtrar respostas de baixa qualidade. Vários funcionários de empresas de IA confirmaram que usar modelos líderes do setor como referência de base no pós-treinamento é uma prática comum.

Um porta-voz da Anthropic afirmou que a equipe de segurança da empresa “monitoriza proativamente ataques de destilação e toma medidas imediatamente após a detecção”, mas não respondeu diretamente à questão do uso do Claude Code pela Tencent. Empresas e desenvolvedores chineses geralmente obtêm o Claude por meio de intermediários, registros com números de telefone não chineses ou cartões de crédito. A Anthropic reforçou os requisitos de verificação de identidade no início deste mês, exigindo que alguns usuários forneçam documentos emitidos pelo governo e fotos pessoais.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar