Li Auto lança o próximo modelo base de condução autónoma de próxima geração, MindVLA-o1: vê com mais precisão e pensa mais profundamente

K-LinePoet

2026-03-28 20:45:36

Geração de resumo em curso

IT之家 3 de março de 2026, notícias, hoje, o responsável pelo modelo base da Li Auto, Zhan Kun, participou do NVIDIA GTC 2026 e fez um discurso intitulado “MindVLA-o1: Abrindo o Paradigma Universal - Exploração do Próximo Grande Modelo de Condução Autónoma Unificado de Visão-Linguagem-Ação”, apresentando o próximo modelo base de condução autónoma da Li Auto, o MindVLA-o1.

Segundo foi apresentado, o MindVLA-o1 constrói um modelo base de condução autónoma voltado para a inteligência do mundo físico através de cinco grandes inovações tecnológicas - compreensão do espaço 3D, pensamento multimodal, geração unificada de comportamentos, aprendizagem por reforço em ciclo fechado e design colaborativo de hardware e software.

De acordo com o IT之家, os principais avanços deste modelo podem ser resumidos nos seguintes cinco dimensões:

Ver com mais precisão (compreensão do espaço 3D): Os sistemas anteriores lidavam mais com imagens planas, enquanto o MindVLA-o1 combina câmeras e LiDAR, permitindo que o carro perceba a profundidade, distância e estado de movimento dos objetos, compreendendo realmente o espaço físico tridimensional.

Pensar com mais profundidade (pensamento multimodal): Este é o primeiro modelo capaz de “imaginar” o futuro. Através do modelo de mundo oculto, ele não apenas vê o presente, mas também pode “ensaiar” antecipadamente cenários que podem ocorrer nos próximos segundos em um espaço invisível, permitindo decisões mais preditivas.

Mover-se com mais estabilidade (geração unificada de comportamentos): O sistema adota a arquitetura VLA-MoE, equipada especificamente com “especialistas em ações”. Ele pode gerar simultaneamente todos os pontos de trajetória de condução e, através de um processo de otimização semelhante à “remoção de ruído”, garantir que o carro se mova de forma suave e de acordo com as leis físicas.

Evoluir mais rapidamente (aprendizagem por reforço em ciclo fechado): A Li Auto construiu um poderoso simulador de mundo. O modelo não apenas aprende na estrada, mas também pode realizar auto-práticas e otimização de estratégias em larga escala e alta eficiência no mundo virtual, reduzindo drasticamente os custos de treinamento.

Implantar de forma mais eficiente (colaboração de hardware e software): Através da pesquisa do equilíbrio entre a precisão do modelo e a latência do hardware, a Li Auto reduziu o tempo de design da arquitetura de meses para dias, permitindo que grandes modelos complexos funcionem de forma mais fluida nos chips dos veículos.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

1 gostos