L'efficacité de la politique de prévention de la distillation des grands modèles est douteuse : la distillation n'est qu'une solution de facilité pour les données des laboratoires indépendants, et le blocage ne peut pas empêcher la Chine de rattraper l'IA

robot
Création du résumé en cours
Selon le suivi Beating, face aux tentatives de Washington et d'Anthropic de couper la voie de « distillation » des grands modèles chinois en bloquant les modèles de pointe, Kevin S. Xu, ancien responsable de la stratégie internationale de GitHub et fondateur d'Interconnected Capital, a déclaré que la distillation antagoniste n'était qu'une solution de secours désespérée pour certains laboratoires indépendants chinois en manque de données, et que bloquer l'API ne pouvait en aucun cas arrêter globalement les progrès de l'IA chinoise.
Les laboratoires indépendants pointés du doigt, DeepSeek, Moon Shadow et MiniMax, manquent de soutien écologique de groupe et souffrent d’un déficit de données de haute qualité pour la raisonnement et l’entraînement ultérieur.
En revanche, les grands laboratoires soutenus par Alibaba (Qwen), ByteDance (Seed) ou Xiaomi disposent de vastes données de scénarios internes, équivalentes à celles de Google ou Apple, et ne dépendent pas de la distillation.
Ainsi, la politique de blocage ne fait que freiner temporairement les laboratoires indépendants, sans ébranler la fondation des grands acteurs chinois.
L'idée répandue selon laquelle la Chine possède un « avantage en données » est en réalité une erreur : en ce qui concerne la annotation de connaissances de haute qualité et les données d’évaluation nécessaires à la formation de modèles de pointe, la Chine ne dispose pas d’un avantage, mais souffre même d’un déficit sérieux par rapport à des chaînes d’approvisionnement en données commerciales matures comme Scale AI ou Surge.
En raison de la faible qualité des fournisseurs de services de données locaux, les laboratoires indépendants, désespérés, ont également adopté la distillation via API comme une stratégie d’acquisition de données bon marché, par paresse à prendre des raccourcis.
Cependant, l’industrie de l’annotation de données est une activité commerciale à faible barrière d’entrée, et non une faiblesse technologique comme les machines de lithographie ; le déficit de l’offre et de la demande domestique peut facilement être comblé.
À long terme, un modèle étudiant purement distillé ne pourra pas dépasser la limite théorique de son enseignant, mais étant donné que les grands modèles sont toujours construits par des ingénieurs humains, peu importe si les États-Unis coupent ou non l’accès à l’API, des développeurs chinois intelligents et travailleurs finiront par briser cette limite, en concevant des modèles dépassant leurs mentors.
La politique de blocage américaine est non seulement inefficace, mais pourrait aussi couper prématurément la voie à une contrainte théorique qui pourrait enfermer les modèles chinois dans un plafond de « étudiants ».
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé