Robô “não consegue se alimentar”, dados reais continuam sendo o campo de batalha da inteligência incorporada

robot
Geração de resumo em curso

Os problemas com os dados são um dos principais desafios que a industrialização e a evolução inteligente da indústria de robótica enfrentam neste momento.

No dia 28 de março, como fórum paralelo do Fórum de Zhongguancun, na 2026 Conferência Chinesa de Ficção Científica, foi oficialmente inaugurado no local, em Pequim, distrito de Shijingshan, o Centro de Treino e Inovação de Formação para Inteligência Corporal Táctil e Perceção Multimodal.

Segundo os repórteres, o centro foi criado em parceria entre o Grupo de Inovação Científica e Tecnológica de Shijingshan, Pequim, Co., Ltd., e a Heishan Technology, ancorando-se nas necessidades de desenvolvimento da indústria da inteligência corporal. Foram definidos três grandes eixos técnicos: tacto, heterogeneidade e captação autónoma sem operador. O objetivo é construir uma plataforma de conversão tecnológica de ponta a ponta que integre recolha de dados multimodais, treino de algoritmos e implementação em cenários.

Os problemas com os dados são um dos principais desafios que a industrialização e a evolução inteligente da indústria de robótica enfrentam neste momento. Na sessão do Fórum de Zhongguancun “Diálogo de Centenas de Milhões para Inteligência Corporal”, o cofundador da Xingdong Yuan, Xiyue, considera que a maior dificuldade do desenvolvimento da inteligência corporal continua a ser, ainda, os dados.

Tendo em conta cenários concretos de implementação nos negócios, Xiyue afirma que recolher dados em cenários reais é difícil, exigindo que as partes dos cenários abram permissões; ao mesmo tempo, a recolha em grande escala acarreta problemas de custo elevado e tempo prolongado. Além disso, as soluções de substituição existentes têm limitações: o setor costuma usar o modelo de construção de um estaleiro de treino 1:1 que replica cenários reais, mas, por depender de engenheiros participarem ao longo de todo o processo de recolha, treino, implementação e localização de problemas, isso leva a baixa eficiência geral e custos elevados.

Xiyue acredita que o setor pode construir um “roda de recolha de dados — iteração de modelos” em ciclo fechado, permitindo que os robôs processem autonomamente todo o tipo de situações extremas em ambientes reais e, assim, melhorem continuamente a eficiência do sistema. Em segundo lugar, deve-se promover um modelo combinado de “demonstrações humanas + recolha de dados em robôs reais”, mas atualmente ainda é necessário ultrapassar o desafio de diferenças entre os dois em termos de constituição do corpo, formas de movimento e métodos de perceção.

O fundador da Yuanli Lingji, Tang Wenbin, reconhece que os dados são um dos gargalos atuais da inteligência corporal, mas não são o único problema. Na sua perspetiva, a recolha de dados é, em essência, uma questão de dinheiro e de tempo: ao investir capital para comprar robôs, construir estaleiros de treino, contratar operadores remotos e subcontratar a rotulagem, consegue-se acumular rapidamente dados de milhões de horas e amostras na escala de centenas de milhões. Por isso, “ter ou não ter dados” não é uma barreira do setor. A verdadeira vantagem competitiva reside em saber se a empresa consegue fazer o retorno automático dos dados a partir de cenários reais e se consegue montar um ciclo em roda eficiente de recolha de dados em ciclo fechado.

A Zhi Ping actualmente já possui várias vias de obtenção de dados, mas voltando à realidade, o cofundador Zhang Peng ainda considera que o valor dos dados de cenários reais não tem substituto — e este é o rumo que a indústria deve agora priorizar: uma parte, ao implementar produtos nas frentes com dados de recolha e ao conseguir fazer o retorno e sedimentar esses dados, é a mais valiosa das carteiras de ativos de dados. Com a devida salvaguarda da segurança, a Zhi Ping também partilhará esta parte dos dados com os clientes.

Segundo os repórteres, no momento, o projeto da quarta fase do Centro de Recolha e Treino de Dados para Robôs Humanóides em Shijingshan, Pequim, tem principalmente parcerias com empresas como Leju, Heishan, Reilman, Lingchu, entre outras, na tentativa de resolver a escassez de dados e os gargalos de qualidade na indústria de robôs.

Quanto ao problema de oferta e procura de dados de robôs, uma pessoa do setor disse ao repórter que, atualmente, o domínio da inteligência corporal está a passar por uma reestruturação do sistema de dados. O surgimento de tecnologias de dados sem modelo próprio (como a solução EGO para dados em primeira pessoa e a solução UMI para interfaces de operações generalizadas) faz com que, no passado, as fábricas de recolha de dados baseadas em operação remota, que dependiam de investimento em ativos elevados, possam enfrentar dificuldades no desenvolvimento.

Em termos do valor dos dados, essa pessoa afirmou que os dados de cenários reais continuam a ser o topo da pirâmide dos dados necessários ao treino de modelos de robôs; no entanto, a indústria enfrenta, em geral, dois problemas principais: em primeiro lugar, falta padronização na qualidade dos dados e no desenho dos pipelines de dados; em segundo lugar, há uma diferença significativa na capacidade de processamento de dados entre setores — não é que todos os fabricantes tenham força técnica para montar um sistema de processamento de dados eficiente. Além disso, dentro do setor, faltam mecanismos unificados para partilha de “truques” técnicos de dados e um sistema de avaliação de referência, o que leva a diferentes níveis de eficiência de aplicação dos dados.

Essa pessoa afirmou que, se no futuro tecnologias de dados sem modelo próprio como EGO e UMI conseguirem ser popularizadas, pode-se ampliar ainda mais a escassez essencial de recursos de cenários. As empresas também poderão possivelmente libertar-se da dependência das tradicionais fábricas de recolha de dados, concluindo diretamente a recolha de dados em cenários reais; a acessibilidade e a diversidade dos cenários tornar-se-ão variáveis-chave da competitividade dos dados.

Assim, a partir da tendência de atualização e iteração tecnológica, a inteligência corporal precisa de dados de treino na escala de milhões de horas. No momento, o total ainda é gravemente insuficiente, mas alguns ativos essenciais que estão desalinhados das principais rotas tecnológicas no futuro podem enfrentar risco de desvalorização: por exemplo, centros pesados dependentes do corpo do robô e de instalações fixas podem causar queda na taxa de utilização da capacidade e disparo do custo unitário.

A longo prazo, a lógica central de competitividade na área de dados sofrerá uma mudança fundamental: deixar de ser uma disputa de hardware sobre “se há ou não centros de treino em escala” e passar a depender de capacidades de aquisição em cenários reais, eficiência dos ciclos fechados entre cenários e dados, e assim por diante.

Fluxo massivo de informações, interpretação precisa — tudo na app Sina Finance

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar