Mémo interne de Tencent révélé : le dernier modèle Hy3 utilise le code Claude lors de la phase post-formation

Selon une surveillance menée par Dongcha Beating, The Information a cité des sources proches du dossier et un mémo interne de Tencent révélant que des employés de Tencent utilisaient Claude Code d'Anthropic lors de la phase post-formation du développement du modèle Hy3, malgré l'interdiction explicite d'Anthropic concernant les services commerciaux aux entreprises chinoises pour des raisons de sécurité nationale. Hy3 est le modèle de langage large le plus puissant de Tencent à ce jour, doté d'une architecture MoE de 295 milliards de paramètres, et a été développé sous la direction du scientifique en chef de l'IA, Yao Shunyu, qui a rejoint Tencent à la fin de l'année dernière. Pendant la phase RLHF (Apprentissage par Renforcement à partir de Feedback Humain), Tencent a organisé ses employés pour agir en tant qu'évaluateurs humains, et le mémo interne fournissait des directives d'installation pour Claude Code, avec une limite d'utilisation de « milliers de tokens » par personne. Les employés de Tencent ne considéraient pas cela comme une distillation (entraîner un modèle plus faible en utilisant les sorties d’un modèle plus puissant). Leur approche consistait à poser les mêmes questions de programmation à deux modèles anonymes et à effectuer des évaluations à l’aveugle ; simultanément, ils utilisaient Claude Code pour générer en temps réel des exemples comportementaux de haute qualité en tant que références pour aider à filtrer les réponses de faible qualité. Des employés de plusieurs entreprises d’IA ont confirmé que l’utilisation de modèles de référence de premier plan dans l’industrie lors de la phase post-formation est une pratique courante. Un porte-parole d’Anthropic a déclaré que l’équipe de sécurité de l’entreprise « surveille activement les attaques de distillation et prend des mesures immédiates dès leur détection », mais n’a pas directement abordé l’utilisation de Claude Code par Tencent. Une méthode courante pour les entreprises et développeurs chinois d’accéder à Claude consiste à passer par des intermédiaires ou à s’inscrire avec des numéros de téléphone ou des cartes de crédit non chinois. Plus tôt ce mois-ci, Anthropic a renforcé ses exigences de vérification, certains utilisateurs devant fournir des photos d’identité émises par le gouvernement et des photos personnelles.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire