Fórum Zhongguancun 2026 | Líderes em inteligência incorporada discutem o impasse de dados e a inovação de cenários

robot
Geração de resumo em curso

(Fonte: Beijing Business Daily)

No dia 27 de março, no âmbito da “Conferência Anual do Fórum de Zhongguancun 2026” realizou-se um debate em mesa-redonda sobre “A Fronteira do Open Source da IA” centrado na inteligência corporizada. Segundo o “Relatório sobre o Desenvolvimento da China 2025” publicado pelo Centro de Investigação para o Desenvolvimento do Conselho de Estado, a indústria de inteligência corporizada da China encontra-se numa fase inicial; espera-se que o tamanho do mercado atinja 4000 mil milhões de yuan em 2030 e ultrapasse 1 bilião de yuan em 2035. No ponto de partida desta via de biliões, personalidades de destaque de empresas como Galaxy General, Qianxun Intelligence, Xingdong Yiyuan, entre outras, participaram num aprofundado diálogo em torno da construção do “piramide de dados”, da arquitetura “cérebro-cerebelo” e das vias para a implementação em cenários reais, explorando os principais desafios e ideias de rutura para a inteligência corporizada passar, em 2026, dos laboratórios para aplicações em escala.

Wang He, fundador da Galaxy General: A pirâmide de dados será amplamente utilizada em 2026

A via da inteligência corporizada em 2025 foi totalmente ativada: o capital entrou, surgiram modelos em abundância e alguns conceitos ficaram cada vez mais claros, incluindo as definições de “cérebro” e “cerebelo” de robôs humanoides.

O cérebro é responsável por produzir saídas desde a perceção, passando pela cognição, até ao planeamento de ações; o cerebelo, através dessas saídas, executa as ações no próprio com uma forma robusta, proporcionando elevada flexibilidade e estabilidade. Depois de cérebro e cerebelo se integrarem, desbloqueiam-se tarefas como operações, navegação e movimentos de corpo inteiro.

A inteligência corporizada forma uma pirâmide de dados clara no nível de dados: na base estão os dados da Internet; acima, os dados do comportamento humano; mais acima, os dados sintéticos; e no topo, os dados do mundo real. Esta pirâmide de dados foi estabelecida em 2025 e será amplamente utilizada em 2026. Nessa altura, todo o conjunto de tecnologias que acopla o VLA (modelo de ações visuais e linguísticas) e o modelo de ações do mundo real dará um salto verdadeiramente relevante.

Xi Yue, cofundador da Xingdong Yiyuan: Construir uma “roda de dados” é a chave para a rutura

Neste momento, a maior dificuldade da inteligência corporizada ainda está nos dados. Para o robô trabalhar de forma autónoma na fábrica ou em ambientes especiais, é necessário recolher dados no ambiente real. Mas os cenários são difíceis de abrir, os custos de recolha em larga escala são elevados e o processo é extremamente moroso.

Atualmente, a solução mais comum é replicar cenários reais: montar um ambiente 1:1 no campo de treino. No entanto, isso não resolve todos os problemas; depender de engenheiros para recolher, treinar e implementar novamente, num ciclo contínuo, é um modelo extremamente ineficiente e dispendioso.

A nossa solução é construir uma “roda de dados”, um ciclo fechado que vai da recolha de dados ao modelo, para que o robô processe autonomamente os corner cases (casos-limite) em ambientes reais, melhorando continuamente a eficiência por si próprio. Também estamos a explorar modos de recolha de dados com combinação de humanos e máquinas reais.

Gao Yang, cofundador da Qianxun: 2025 é a era do GPT-2.0 da inteligência corporizada; 2026 será a era do GPT-3.0

Na minha perceção, a inteligência corporizada também tem etapas como GPT-2.0 e GPT-3.0: em 2025 está-se na fase 2.0, que resolveu muitos problemas fundamentais de infraestruturas a nível de dados, preparando com antecedência para a escalabilidade; em 2026, o foco do trabalho será tratar modelos cada vez maiores, dados cada vez mais abundantes e garantir o desempenho em escala.

Na verdade, no processo de desenvolvimento, é muito difícil ver realmente em que fase se está agora; é como estar numa névoa. Eu defino os estágios de 2025 como fase inicial de 2.0 ou 3.0, porque alguns modelos atuais já têm algumas capacidades básicas de generalização, tal como o GPT-2.0, que já tem diálogos básicos, embora muitas vezes o conteúdo esteja incorreto. Através de investigação conjunta na academia e na indústria, é bem possível que, no fim de 2026 ou em meados de 2027, surjam modelos como o GPT-3.0.

Zhang Peng, cofundador da Zhixiao Pingfang: A validação de cenários é a palavra-chave de 2025

O mais importante em 2025 é levar a validação de cenários à prática, fazendo com que os robôs saiam do laboratório e cheguem a cenários reais. Em 2026, o que se pretende resolver com mais frequência é como tornar os modelos dos robôs cada vez melhores.

Do ponto de vista técnico, é necessário ultrapassar a capacidade de generalização em cenários reais: a partir da arquitetura do modelo e do desenho do sistema, fazer com que o robô se adapte a mais cenários com um custo menor — esse é um desafio muito grande para a indústria. Queremos recolher mais dados em cenários reais; com base nesses dados, gerar mais valor através de meios como a síntese, reduzindo os custos. No mundo real, o caminho deverá ser a fusão entre o modelo, o hardware e o sistema de cenários, para resolverem os problemas em conjunto.

Repórter do Beijing Business Daily, Wei Wei

Notícias em grande quantidade e análises precisas — tudo na aplicação Sina Finance

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar