宇树 verifica una nueva tendencia: el campo de batalla central de la inteligencia corpórea no es solo el modelo

robot
Generación de resúmenes en curso

La competencia en la inteligencia incorporada está entrando en una nueva etapa. Con el lanzamiento del modelo WVLA2.0 de inteligencia incorporada por parte de Yushu Technology y la finalización de una demostración sin control remoto, la industria se da cuenta cada vez más claramente de que el núcleo de esta competencia no depende únicamente del tamaño del modelo, sino de una capacidad integral que abarca el diseño de arquitectura de baja latencia, la integración coordinada de software y hardware, y la acumulación de datos físicos.

Según un informe de investigación publicado por Nomura International el 28 de junio, los analistas visitaron personalmente Yushu Technology el 15 de junio. En la demostración, el robot G1 equipado con WVLA2.0 (World-model Vision-Language-Action) completó de forma autónoma seis tareas consecutivas en un entorno de sala de conferencias con interferencias, sin necesidad de control remoto, con un ciclo de inferencia de aproximadamente 90 ms, lo que equivale a unas diez iteraciones por segundo. Esta es la primera versión con potencial de despliegue comercial después de dos años de desarrollo por parte de Yushu Technology. La gerencia identifica la fabricación industrial (ensamblaje de motores de articulaciones, carga y descarga de materiales, y manejo de herramientas y accesorios) como el primer escenario de implementación comercial, y considera los datos de operación física a gran escala de la flota global de robots como un activo central.

El informe de Nomura también analizó el marco de arquitectura NeuralAxis presentado por NXP en COMPUTEX 2026. Este marco fue propuesto por el presidente y CEO de NXP, Rafael Sotomayor, y su idea central está altamente alineada con el enfoque de ingeniería de Yushu Technology: el verdadero cuello de botella de la IA física no radica en la escala de inferencia de los modelos de lenguaje, sino en la capacidad de construir una capa de control de borde similar al reflejo espinal humano, con una latencia tan baja como 40 ms.

La implicación directa de estos avances para los inversores es: La dinámica competitiva de la inteligencia incorporada está evolucionando desde "quién tiene el modelo más fuerte" hacia "quién tiene el sistema más completo". La ventaja defensiva que Yushu Technology ha construido mediante la integración completa de pila propia y la ventaja de datos físicos es difícil de replicar para los proveedores de modelos puramente en la nube.

NeuralAxis: Redefiniendo los límites de la arquitectura de sistemas de IA física

El marco NeuralAxis (arquitectura de eje neuronal) de NXP, inspirado en el sistema nervioso humano, descompone la lógica de control de la IA física en tres niveles desacoplados pero coordinados: la capa de inferencia (latencia de aproximadamente 300 ms), correspondiente a la corteza cerebral; la capa de coordinación (responsable del control de movimiento y equilibrio), correspondiente al cerebelo; y la capa de reflejo (latencia tan baja como 40 ms), correspondiente a la médula espinal, desplegada en el borde cerca de los actuadores.

Para los robots humanoides, las implicaciones de este marco son las más profundas.

NeuralAxis aboga por reemplazar el "cerebro central" centralizado con procesadores de reflejos distribuidos: implementar capacidad de toma de decisiones autónoma local en las articulaciones, manos y pies, logrando la ejecución local de acciones como el control de fuerza de agarre y el equilibrio del tobillo, y completando la recuperación en cadena del equilibrio, agarre, postura y marcha en 40 ms. El desacoplamiento de la inferencia y el control de movimiento también permite agregar nuevas habilidades de manera continua mientras se mantiene la estabilidad del movimiento.

La extensión comercial de este marco también merece atención. Según la investigación de la industria de Nomura, en comparación con las soluciones de automatización tradicionales, la arquitectura NeuralAxis puede generar una mejora significativa en la eficiencia de fabricación, y se espera que las ventas de robots de diagnóstico también aumenten considerablemente. Además, la misma arquitectura puede comprimir la latencia de extremo a extremo de los drones a menos de 20 ms y estratificar la lógica de control de los vehículos definidos por software en áreas de ejecución de inferencia, coordinación y seguridad crítica.

WVLA2.0: La ruta de implementación de la fusión de modelos y la colaboración software-hardware

La trayectoria técnica de WVLA2.0 de Yushu Technology muestra una clara divergencia con la corriente principal de la industria.

La mayoría de las soluciones similares apuestan por la generación pura de extremo a extremo VLA (visión-lenguaje-acción), mientras que WVLA2.0 fusiona la capacidad de predicción del modelo WMA (World-Model Action) con la generación de acciones de VLA, mejorando de manera integral la comprensión de tareas de alto nivel, el razonamiento semántico espacial 2D/3D, la generación de acciones con restricciones dinámicas y la capacidad de resistencia a interferencias.

A nivel de percepción, el sistema integra cuatro flujos visuales paralelos: una cámara de profundidad RealSense, un LiDAR Livox MID360 y dos cámaras laterales, construyendo una representación espacial de 360 grados con un retraso de actualización de posición inferior a 10 ms en condiciones de interferencia. En el diseño de colaboración software-hardware, los parámetros de acción después de la inferencia se envían a las 23 articulaciones del G1 a través del bus CAN. Con el módulo de control de movimiento "cerebelo" desarrollado internamente por Yushu Technology, el error de posicionamiento al agarrar objetos de menos de 2 kg con un solo brazo se puede controlar dentro de los 5 mm.

En la arquitectura de computación, WVLA2.0 comprime la potencia informática de borde a menos de 100 TOPS, ejecutándose completamente en el NVIDIA (NVDA US, sin calificar) Jetson Orin NX del G1 EDU, sin necesidad de dependencia en la nube. La gerencia indica que este diseño evita el riesgo de interrupción de tareas debido a la latencia de red o la desconexión.

Cambio de paradigma de datos: "Adquisición sin cuerpo físico" se vuelve dominante

El cambio en el modo de adquisición de datos es otra señal importante en este informe.

La demostración de Yushu Technology muestra que, en una sola grabación sin intervención remota, el G1 puede completar de forma autónoma múltiples tareas continuas en un entorno con interferencias, lo que significa que la "adquisición de datos sin cuerpo físico" se está convirtiendo en el paradigma dominante de producción de datos para la inteligencia incorporada, es decir, el robot acumula datos mediante su propia percepción y toma de decisiones, sin depender de la anotación manual remota.

La investigación de la industria de Nomura también señala las limitaciones actuales: el sistema todavía tiene zonas ciegas y brechas de percepción trasera, la velocidad de ejecución es lenta, la precisión de operaciones finas es insuficiente y carece de datos de referencia cuantitativos de tasa de éxito continuo. Estas deficiencias también delimitan el límite prioritario de la implementación comercial a corto plazo.

Basándose en esto, la gerencia ha formulado una hoja de ruta de implementación por etapas: la fabricación industrial (ensamblaje de motores de articulaciones, carga y descarga de materiales, manejo de herramientas y accesorios) se identifica como el primer punto de aterrizaje, ya que la propia fábrica de Yushu Technology puede proporcionar un ciclo cerrado de datos; en segundo lugar, la clasificación logística y el ensamblaje flexible 3C; y los escenarios de atención médica y cuidado en el hogar, debido a la mayor dificultad del entorno abierto no estructurado, se consideran objetivos a más largo plazo.

Integración de pila completa: Dos dimensiones de la barrera diferenciadora de Yushu Technology

La conclusión central del informe de Nomura se puede resumir en un juicio: En el proceso de comercialización de la inteligencia incorporada, la capacidad del modelo es ciertamente importante, pero no es la única variable determinante.

La gerencia de Yushu Technology define la competitividad diferenciadora de la empresa en dos niveles: primero, la capacidad de integración de pila completa autodesarrollada desde la percepción, el modelo hasta el control de movimiento; segundo, la acumulación de grandes volúmenes de datos de operación física gracias a la flota global de robots. Estos dos activos se refuerzan mutuamente: el hardware autodesarrollado genera datos exclusivos, y los datos retroalimentan la iteración del modelo, formando un ciclo cerrado difícil de penetrar para los proveedores de modelos en la nube.

Desde la perspectiva del panorama competitivo del mercado, la lógica de implementación del marco NeuralAxis y WVLA2.0 apunta a la misma conclusión: el campo de batalla central de la inteligencia incorporada se está desarrollando simultáneamente en la capa de arquitectura del sistema y la capa de datos. Para los inversores, la dimensión para evaluar a los participantes del sector debe extenderse desde la única "capacidad del modelo" hacia una capacidad de integración de sistemas más completa y la escala de acumulación de datos físicos.


El contenido anterior proviene de la mesa de operaciones ZhuiFeng.

Para obtener interpretaciones más detalladas, incluyendo interpretaciones en tiempo real e investigaciones de primera línea, únete a [**Mesa de operaciones ZhuiFeng ▪ Membresía anual**]

![](https://img-cdn.gateio.im/social/moments-f187f887a1-07b7e18c28-8b7abd-62a40f)

Aviso de riesgos y cláusula de exención de responsabilidad

          

            El mercado tiene riesgos, la inversión debe ser cautelosa. Este artículo no constituye un consejo de inversión personal, ni considera los objetivos de inversión, situación financiera o necesidades especiales de usuarios individuales. Los usuarios deben considerar si las opiniones, puntos de vista o conclusiones en este artículo se ajustan a sus circunstancias específicas. Las inversiones basadas en esto son responsabilidad propia.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado