Miembro de la Conferencia Consultiva Política del Pueblo Chino, Zhou Yuan: Se debe promover la circulación ordenada de datos en comunidades de contenido en Internet

robot
Generación de resúmenes en curso

CNR Beijing, 11 de marzo (Reportero Fan Rui) En la reunión anual de la Asamblea Popular Nacional, el miembro de la Conferencia Consultiva Política de China, decimocuarta legislatura, miembro del Comité de Sociedad y Legalidad, y fundador y CEO de Zhihu, Zhou Yuan, se centró en las comunidades de contenido en línea de grandes modelos de inteligencia artificial y propuso construir un mecanismo que promueva la circulación ordenada de datos.

Zhou Yuan señaló que, actualmente, la construcción de datos se centra principalmente en datos gubernamentales y conjuntos de datos públicos, mientras que el contenido profesional de alta calidad acumulado a largo plazo en el espacio de Internet aún no recibe la atención que merece. En la realidad, las comunidades profesionales en campos como tecnología, medicina, derecho y finanzas reúnen una gran cantidad de contenido de conocimiento producido continuamente por expertos y profesionales, caracterizado por su alta especialización, semántica rica y enfoque práctico. Estos son datos clave para que los grandes modelos comprendan problemas complejos y respalden decisiones de alta calidad.

“Si no se establece rápidamente un mecanismo para la circulación ordenada y el uso conforme de contenido profesional en Internet, no solo afectará los derechos de los creadores originales, sino que también limitará la competitividad a largo plazo de nuestra industria de IA”, afirmó Zhou Yuan. Considera que es urgente impulsar avances en este aspecto desde una perspectiva estratégica.

Él opina que se debe apoyar a las comunidades de contenido en línea para que abran servicios de datos mediante interfaces API estándar a los grandes modelos. Actualmente, algunas empresas de IA obtienen contenido en la web mediante arañas sin autorización, lo que genera frecuentes disputas de derechos de autor, dudas sobre la legalidad de las fuentes de datos, dificultades para proteger los derechos de plataformas y creadores originales, y riesgos de litigios y no conformidad para las empresas de modelos, elevando objetivamente los costos invisibles del sistema en la industria. Zhou Yuan sugiere que las autoridades regulatorias puedan incluir en sus políticas el sistema de servicios de datos en tiempo real mediante API estandarizadas para comunidades de contenido en línea, considerándolo una parte clave para la circulación ordenada de los elementos de datos.

Al mismo tiempo, Zhou Yuan señala que se puede alentar y apoyar a las empresas relevantes a realizar tareas de etiquetado de datos de expertos de alta calidad. Con la competencia en grandes modelos entrando en una fase profunda, la “calidad” de los datos se ha vuelto mucho más importante que la “cantidad”. Se debe apoyar a las comunidades de contenido para aprovechar su ventaja en la concentración de talento, ofreciendo servicios de etiquetado y evaluación de contenido a nivel experto; también promover pilotos de “activos de datos de expertos”, con políticas preferenciales en inversión en I+D y subsidios a talentos.

Además, se puede apoyar a las plataformas de contenido en línea para participar en la construcción de plataformas abiertas y de código abierto de corpus especializados en áreas clave. Las plataformas internacionales de código abierto, mediante la creación de ecosistemas colaborativos de “modelo—datos—evaluación” y sistemas de licencias abiertas maduros, han reunido recursos de desarrolladores globales y se han convertido en infraestructura de datos importante para la industria de inteligencia artificial. Zhou Yuan opina que, bajo la orientación de las autoridades regulatorias, se debe apoyar a las comunidades de contenido en línea a colaborar con asociaciones industriales y centros de investigación para construir plataformas abiertas de corpus especializados en áreas clave, formando un ciclo virtuoso de “producción comunitaria—gobernanza de plataformas—retroalimentación de modelos—optimización continua”, promoviendo que los recursos de conocimiento profesional acumulados en las comunidades de contenido en línea se conviertan en fuentes de datos de entrenamiento de modelos grandes que sean conformes, estables y sostenibles, consolidando la base de datos para el desarrollo de la industria de inteligencia artificial en nuestro país.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado