Yushu verifica uma nova tendência: o campo de batalha central da inteligência incorporada, não é apenas o modelo.

robot
Geração do resumo em andamento

A competição da inteligência incorporada está entrando em uma nova fase. Com o lançamento do grande modelo incorporado WVLA2.0 pela Unitree Technology e a demonstração prática sem controle remoto, a indústria percebe cada vez mais claramente: o verdadeiro obstáculo central dessa competição não é simplesmente o tamanho do modelo, mas a capacidade de pilha completa que abrange design de baixa latência, integração coordenada de hardware e software, e acúmulo de dados do próprio corpo (本体数据). De acordo com um relatório de pesquisa divulgado pela Nomura International em 28 de junho, analistas visitaram a Unitree pessoalmente em 15 de junho. Na demonstração, o robô G1 equipado com WVLA2.0 (World-model Vision-Language-Action) completou de forma autônoma seis tarefas consecutivas em um ambiente de sala de conferência com interferências, sem controle remoto, com um ciclo de inferência de aproximadamente 90ms, equivalente a dez iterações por segundo. Esta é a primeira versão com potencial de implantação comercial após dois anos de desenvolvimento da Unitree. A administração listou a manufatura industrial — montagem de motores de junta, carga/descarga e manuseio de acessórios de ferramentas — como o primeiro cenário de aplicação comercial, e considera os dados operacionais físicos em larga escala da frota global de robôs como um ativo central. O relatório da Nomura também analisou a estrutura NeuralAxis lançada pela NXP na COMPUTEX 2026. A estrutura foi proposta pelo presidente e CEO da NXP, Rafael Sotomayor, e sua tese central está altamente alinhada com o caminho de engenharia da Unitree — o verdadeiro gargalo da IA física não está no tamanho da inferência do modelo de linguagem, mas na capacidade de construir uma camada de controle de borda semelhante ao reflexo da medula espinhal humana, com latência tão baixa quanto 40ms. A implicação direta desses avanços para os investidores é: O cenário competitivo da inteligência incorporada está evoluindo de 'quem tem o modelo mais forte' para 'quem tem o sistema mais completo'. O fosso construído pela Unitree com integração de pilha completa auto-desenvolvida e vantagens de dados físicos é difícil de ser replicado por fornecedores de modelos puramente baseados em nuvem. NeuralAxis: Redefinindo os Limites da Arquitetura de Sistemas de IA Física

A estrutura NeuralAxis da NXP é inspirada no sistema nervoso humano, decompondo a lógica de controle da IA física em três níveis desacoplados, porém coordenados: a camada de inferência, correspondente ao córtex cerebral (latência de cerca de 300ms); a camada de coordenação, correspondente ao cerebelo (responsável pelo controle motor e equilíbrio); e a camada reflexa, correspondente à medula espinhal — com latência de até 40ms, implantada na borda próxima aos atuadores. Para robôs humanoides, as implicações dessa estrutura são as mais profundas. O NeuralAxis defende a substituição de um 'cérebro central' centralizado por processadores reflexos distribuídos — implantando capacidades de decisão autônoma local nas articulações, mãos e pés, realizando execução local de ações como controle de força de preensão e equilíbrio do tornozelo, e completando a recuperação em cadeia de equilíbrio, preensão, postura e marcha em 40ms. O desacoplamento entre inferência e controle motor também permite manter a estabilidade do movimento enquanto novas habilidades são continuamente adicionadas. As extensões comerciais dessa estrutura também merecem atenção. A pesquisa setorial da Nomura mostra que, em comparação com soluções de automação tradicionais, a arquitetura NeuralAxis pode trazer melhorias significativas na eficiência de fabricação, e as vendas de robôs de diagnóstico também devem crescer significativamente. Além disso, a mesma arquitetura pode comprimir a latência ponta a ponta de drones para menos de 20ms, e estratificar a lógica de controle de veículos definidos por software em regiões de inferência, coordenação e segurança crítica. WVLA2.0: Caminho de Implementação de Fusão de Modelos e Coordenação Hardware-Software

A rota técnica do WVLA2.0 da Unitree reflete uma divergência clara em relação à tendência dominante do setor. A maioria das soluções similares aposta na geração ponta a ponta puramente VLA (Vision-Language-Action), enquanto o WVLA2.0 funde a capacidade preditiva do modelo WMA (World-Model Action) com a geração de ações do VLA, atualizando de forma abrangente a compreensão de tarefas de alto nível, raciocínio semântico 2D/3D, geração de ações com restrições dinâmicas e capacidade de resistência a interferências. No nível de percepção, o sistema funde quatro fluxos visuais paralelos: uma câmera de profundidade RealSense, um LiDAR Livox MID360 e duas câmeras laterais, construindo uma representação espacial de 360 graus, com latência de atualização de posição controlada em menos de 10ms sob condições de interferência. No design coordenado de hardware e software, os parâmetros de ação pós-inferência são enviados via barramento CAN para as 23 articulações de graus de liberdade do G1, e com o módulo de controle motor 'cerebelo' auto-desenvolvido pela Unitree, o erro de posicionamento ao agarrar objetos abaixo de 2kg com um único braço pode ser controlado dentro de 5mm. Em termos de arquitetura computacional, o WVLA2.0 comprime o poder computacional de borda para menos de 100 TOPS e roda completamente no NVIDIA Jetson Orin NX (NVDA US, não classificado) integrado ao G1 EDU, sem dependência de nuvem. A administração afirmou que esse design evita o risco de interrupção de tarefas devido a latência de rede ou desconexão. Mudança de Paradigma de Dados: 'Coleta Sem Corpo' se Torna Mainstream

A mudança no modo de coleta de dados é outro sinal importante deste relatório. A demonstração da Unitree mostra que, em uma única gravação sem intervenção de controle remoto, o G1 pode concluir autonomamente múltiplas tarefas consecutivas em um ambiente com interferências, o que significa que a 'coleta de dados sem corpo' está se tornando o paradigma mainstream da produção de dados de inteligência incorporada, ou seja, o robô acumula dados contando com sua própria percepção e decisão, em vez de depender de anotação manual por controle remoto. A pesquisa setorial da Nomura também apontou limitações atuais: O sistema ainda apresenta áreas cegas e lacunas de percepção traseira, velocidade de execução relativamente lenta, precisão insuficiente em operações finas e falta de dados de teste de referência quantificados para taxa de sucesso contínua. Essas deficiências também delimitam a fronteira prioritária para a implementação comercial de curto prazo. Com base nisso, a administração traçou uma rota de implementação em etapas: a manufatura industrial (montagem de motores de junta, carga/descarga, manuseio de acessórios de ferramentas) é listada como o primeiro ponto de aterrissagem, pois a própria fábrica da Unitree pode fornecer um ciclo fechado de dados; em seguida, classificação logística e montagem flexível de eletrônicos 3C; e os cenários domésticos e de cuidados médicos são listados como metas de longo prazo devido à dificuldade significativamente maior de ambientes abertos e não estruturados. Integração de Pilha Completa: Duas Dimensões do Diferencial da Unitree

A conclusão central do relatório da Nomura pode ser resumida em um julgamento: No processo de comercialização da inteligência incorporada, a capacidade do modelo é certamente importante, mas não é a única variável determinante. A administração da Unitree define a competitividade diferenciada da empresa em dois níveis: primeiro, a capacidade de integração de pilha completa auto-desenvolvida, desde percepção, modelo até controle motor; segundo, os dados operacionais físicos em larga escala acumulados pela frota global de robôs. Esses dois ativos se reforçam mutuamente — o hardware auto-desenvolvido gera dados exclusivos, e os dados alimentam a iteração do modelo, formando um ciclo fechado que é difícil para fornecedores de modelos em nuvem penetrarem. Do ponto de vista do panorama competitivo do mercado, a lógica de implementação do framework NeuralAxis e do WVLA2.0 aponta para a mesma conclusão: o campo de batalha central da inteligência incorporada está se desdobrando simultaneamente na camada de arquitetura de sistemas e na camada de dados. Para os investidores, a dimensão de avaliação dos participantes da pista deve se estender de uma única 'capacidade de modelo' para uma capacidade de integração de sistemas mais completa e a escala de acúmulo de dados físicos.


O conteúdo excelente acima é do Zhui Feng Trading Desk.

Para interpretações mais detalhadas, incluindo interpretações em tempo real, pesquisa de primeira linha e outros conteúdos, junte-se ao [**Membro Anual do Zhui Feng Trading Desk**]

![](https://img-cdn.gateio.im/social/moments-f187f887a1-07b7e18c28-8b7abd-62a40f)

Aviso de Risco e Isenção de Responsabilidade

          

            Existem riscos no mercado, e o investimento requer cautela. Este artigo não constitui aconselhamento pessoal de investimento e não leva em consideração os objetivos de investimento especiais, situação financeira ou necessidades de usuários individuais. Os usuários devem considerar se quaisquer opiniões, pontos de vista ou conclusões neste artigo são adequados às suas circunstâncias específicas. O investimento com base neste artigo é por conta e risco do próprio investidor.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado