Membro da Conferência Consultiva Política do Povo Chinês, Zhou Yuan: Deve promover a circulação ordenada de dados das comunidades de conteúdo da Internet

robot
Geração de resumo em curso

CNR Beijing, 11 de março — (Repórter Fan Rui) Na sessão nacional do Congresso deste ano, Zhou Yuan, membro da 14ª Comissão Nacional da Conferência Consultiva Política do Povo Chinês, membro da Comissão de Sociedade e Legalidade, fundador e CEO do Zhihu, focou na comunidade de conteúdo da internet de grandes modelos de inteligência artificial, propondo a construção de um mecanismo que promova a circulação ordenada de dados.

Zhou Yuan destacou que, atualmente, a construção de dados concentra-se principalmente em dados governamentais e conjuntos de dados públicos, enquanto conteúdos profissionais de alta qualidade acumulados na internet a longo prazo ainda não receberam a devida atenção. Na prática, comunidades profissionais nos setores de tecnologia, saúde, direito e finanças reúnem uma grande quantidade de conteúdo de conhecimento produzido continuamente por especialistas e profissionais, caracterizando-se por forte especialização, riqueza semântica e prática intensiva, sendo fontes de dados essenciais para que grandes modelos compreendam problemas complexos e apoiem decisões de alta qualidade.

“Se não estabelecermos rapidamente um mecanismo de circulação ordenada e uso conforme das conteúdos profissionais na internet, não apenas prejudicaremos os direitos dos criadores originais, mas também restringiremos a competitividade de longo prazo da nossa indústria de IA”, afirmou Zhou Yuan. Ele acredita que é urgente promover uma ruptura nesse elo-chave a partir de uma estratégia de alto nível.

Ele sugere que se apoie as comunidades de conteúdo da internet a fornecerem serviços de dados por meio de APIs padrão abertas aos grandes modelos. Atualmente, algumas empresas de IA obtêm conteúdos da web por meio de crawlers sem autorização, gerando frequentes disputas de direitos autorais, dúvidas sobre a legalidade das fontes de dados, dificuldades na proteção dos direitos de plataformas e criadores, além de riscos de litígios e incertezas regulatórias para as empresas de modelos, elevando, objetivamente, os custos ocultos do setor. Zhou Yuan propõe que os órgãos reguladores incluam o sistema de serviços de dados em tempo real por APIs padronizadas das comunidades de conteúdo na internet no escopo de apoio político, como uma parte crucial da circulação ordenada de elementos de dados.

Ao mesmo tempo, Zhou Yuan aponta que é possível incentivar e apoiar empresas relevantes a desenvolverem negócios de marcação de dados de alta qualidade por especialistas. Com a competição de grandes modelos entrando em uma fase mais profunda, a “qualidade” dos dados tornou-se mais importante do que a “escala”, devendo-se apoiar as comunidades de conteúdo a aproveitar sua vantagem na concentração de talentos, oferecendo serviços de marcação e avaliação de conteúdo de nível especialista; realizar pilotos de “ativos de dados de especialistas”, concedendo incentivos políticos em investimentos de pesquisa e desenvolvimento, subsídios a talentos, entre outros.

Além disso, também é possível apoiar plataformas de conteúdo da internet na construção de plataformas abertas de corpus profissional para áreas-chave. Plataformas internacionais de código aberto, ao construir ecossistemas colaborativos de “modelo—dados—avaliação” e sistemas de licenciamento de código aberto maduros, agregam recursos de desenvolvedores globais e já se tornaram infraestrutura de dados importante para a indústria de inteligência artificial. Zhou Yuan acredita que, sob orientação dos órgãos reguladores, as comunidades de conteúdo da internet podem colaborar com associações do setor e instituições de pesquisa para co-construir plataformas abertas de corpus profissional voltadas para áreas-chave, formando um ciclo virtuoso de “produção comunitária—governança da plataforma—feedback do modelo—otimização contínua”, promovendo a transformação do conhecimento profissional acumulado na comunidade em fontes de dados de treinamento de modelos grandes, de forma legal, estável e sustentável, consolidando a base de dados para o desenvolvimento da indústria de inteligência artificial do nosso país.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar