La efectividad de la política de prevención de destilación en modelos grandes es cuestionable: la destilación es solo una vía rápida de datos para laboratorios independientes, y el bloqueo no puede detener la carrera de la IA china.

robot
Generación de resúmenes en curso
Según la monitorización de Beating, respecto a los esfuerzos de Washington y Anthropic por bloquear los modelos de vanguardia para cortar el canal de «destilación» de grandes modelos chinos, el ex responsable de estrategia internacional de GitHub y fundador de Interconnected Capital, Kevin S. Xu, señaló que la destilación adversarial es solo una vía de escape desesperada de algunos laboratorios independientes chinos ante la escasez de datos, y que bloquear las API no puede detener el avance general de la IA en China.

Los mencionados DeepSeek, Moonshade y MiniMax son laboratorios independientes que carecen del apoyo del ecosistema de grupo, enfrentando la escasez de datos de alta calidad para pasos de razonamiento y entrenamiento posterior. En comparación, los grandes laboratorios respaldados por Alibaba (Qwen), ByteDance (Seed) o Xiaomi, poseen datos de escenarios propios que no tienen nada que envidiar a Google o Apple, y no dependen de la destilación. Por lo tanto, las políticas de bloqueo solo generan obstáculos a corto plazo para los laboratorios independientes, sin poder socavar la base de los grandes fabricantes chinos.

La supuesta «ventaja de datos» de China que circula en el exterior es en realidad un malentendido: en cuanto a los datos de anotación y evaluación de alta calidad necesarios para entrenar modelos grandes de vanguardia, China no solo no tiene ventaja, sino que además carece gravemente de cadenas de suministro de datos comerciales maduras como Scale AI o Surge. Debido a la baja calidad de los proveedores de datos nacionales, los laboratorios independientes, desesperados y también por pereza de buscar atajos, recurren a la destilación mediante API como estrategia económica para obtener datos.

Pero la industria de anotación de datos es un modelo comercial de baja barrera de entrada, y no presenta los mismos obstáculos técnicos que los fotolitográficos, por lo que la brecha de oferta y demanda en el país puede llenarse fácilmente. A largo plazo, aunque los modelos estudiantiles puramente destilados no puedan superar en teoría a los maestros, dado que los grandes modelos todavía son construidos por ingenieros humanos, los desarrolladores chinos inteligentes y diligentes eventualmente romperán esa limitación, diseñando modelos superiores a sus mentores. La política de bloqueo de EE. UU. no solo es ineficaz, sino que también podría cortar prematuramente la capacidad de China para mantener sus modelos en un «techo de estudiantes» mediante restricciones teóricas.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado