La era de los datos de robots en la «Triada» ha llegado, la fragmentación es cosa del pasado

robot
Generación de resúmenes en curso

La era de crecimiento salvaje en los datos para aprendizaje de robots ha llegado a su fin.

La época en la que los conjuntos de datos estaban por todas partes y cada uno actuaba por separado ya quedó atrás. Para mediados de 2025, todo el ecosistema de robótica de código abierto ha establecido una clara estructura de «triunvirato» — Open X-Embodiment (OXE), LeRobot y InternData-A1 — que definen los estándares actuales para los modelos base de robots, dejando atrás la mayoría de los conjuntos de datos individuales anteriores a 2023, que han perdido competitividad.

De la dispersión a la unificación: esto no es casualidad

Al observar la evolución de los conjuntos de datos de robots en Hugging Face Hub, se puede ver que toda la industria está atravesando una transición de colecciones fragmentadas y orientadas a instituciones hacia un modelo unificado, a gran escala, estandarizado y impulsado por la comunidad.

Este cambio no es casual ni resultado de una imposición externa. Fundamentalmente, entrenar estrategias generales para robots requiere escala y estandarización; desde la perspectiva del ecosistema, los proyectos bien soportados y que encajan con los frameworks principales atraen naturalmente a más desarrolladores.

Los tres ecosistemas muestran sus fortalezas

OXE: el momento ImageNet del campo robótico

Open X-Embodiment es una coalición lanzada a finales de 2023 por 34 laboratorios de robótica líderes. No es un solo conjunto de datos, sino una gran integración de más de 60 conjuntos existentes bajo una arquitectura unificada.

Datos en cifras:

  • Más de 1 millón de trayectorias reales
  • Cobertura de 22 tipos diferentes de robots (desde brazos industriales hasta robots cuadrúpedos y móviles)
  • Todos los datos convertidos al estándar RLDS basado en TensorFlow y Apache Arrow

La lección clave es simple: las operaciones básicas ya están comercializadas. Tareas como agarrar y colocar, abrir cajones, ensamblaje con un solo brazo, ya están «resueltas» en el nivel de datos. Esto significa que la era de ganar dinero vendiendo datos básicos de teleoperación ha llegado a su fin. El valor comercial futuro reside en datos de alta precisión de expertos, operaciones en entornos domésticos reales a largo plazo, o en datos de formas escasas y específicas (como humanoides o en soft).

LeRobot: la respuesta estándar en el ecosistema PyTorch

A diferencia de la línea de investigación de Google/TensorFlow representada por OXE, Hugging Face ha logrado que LeRobot se convierta rápidamente en el estándar de facto para la comunidad de código abierto, especialmente para los entusiastas de PyTorch.

El punto fuerte de este ecosistema es su pila completa: conjunto de datos + modelos + código de entrenamiento + herramientas de evaluación.

Un avance destacado en almacenamiento: LeRobot Dataset v3.0 usa Apache Parquet + MP4/AV1 comprimido, logrando una eficiencia de almacenamiento 5-10 veces superior a versiones anteriores, con tiempos de carga también significativamente mejorados.

Los conjuntos de datos insignia incluyen:

  • DROID 1.0.1: aproximadamente 76,000 conjuntos de datos de más de 50 equipos, recopilados intencionadamente en «entornos exteriores» para reflejar cambios reales al máximo
  • Serie Aloha: datos de doble brazo de alta precisión y datos de doble brazo móvil

La enseñanza práctica: los estándares de entrega de datos ya son permanentes en Parquet + MP4. Cualquier proveedor comercial que aún use paquetes ROS o videos en bruto está añadiendo cargas técnicas innecesarias a sus clientes.

El «revés» de los datos sintéticos: InternData-A1

La tercera fuerza proviene de datos sintéticos de alta fidelidad a gran escala. InternData-A1, del Laboratorio de IA de Shanghái, representa los avances más recientes en esta dirección:

  • Escala: 630,000 trayectorias, equivalentes a 7,433 horas de trabajo robótico
  • Diversidad física: no solo objetos rígidos, sino también objetos articulados, fluidos, partículas y materiales deformables (como telas y cuerdas)
  • Stack tecnológico: motores físicos avanzados + aleatorización de dominio + renderizado realista + generación automática de cursos

La brecha con la realidad: el techo de los datos sintéticos

Pero aquí hay un punto de inflexión clave: aunque los datos sintéticos avanzan, no son omnipotentes.

Un estudio integral de octubre de 2025 revela que, pese a los avances en ingeniería, las diferencias fundamentales entre simulación y realidad no se han eliminado, solo se han reducido a áreas más estrechas pero aún críticas.

Los principales desafíos incluyen:

Brecha en la dinámica: incluso los mejores motores físicos de 2025 tienen dificultades con fenómenos caóticos, objetos deformables, superficies delgadas (como patrones de pliegues y memoria de arrugas) y errores acumulados en la integración numérica. Las estrategias que funcionan en simulación pueden fallar en tareas de contacto intensivo en el mundo real.

Brecha en percepción y sensores: aunque el renderizado sintético alcanza un realismo fotográfico, persisten artefactos sistemáticos — modelos de defectos de cámaras reales, falta de dispersión subsuperficial, efectos de halo, polvo, etc.

Brecha en control de ejecución: los robots reales tienen controladores ocultos que se desvían con el tiempo, requiriendo ajustes finos para cada unidad.

Brecha en la robustez del sistema: controladores de seguridad, latencia en comunicaciones, cumplimiento del suelo no modelado, son difíciles de replicar con precisión en simulación.

Los datos muestran que los modelos base actuales (RT-2-X, Octo, etc.) migrando de simulación a robots reales, experimentan una caída en éxito del 40-80%, siendo más severa en tareas con objetos deformables, contacto intensivo y a largo plazo.

En realidad, los datos reales aún no están obsoletos

Aunque las estrategias de mitigación como la aleatorización de dominio, el modelado residual y el entrenamiento híbrido (90-99% sintético + 1-10% real) avanzan, la realidad es que, en octubre de 2025, la transferencia de modelos desde simulación sin datos reales sigue limitada a tareas de rigidez moderada y entornos controlados.

Para aplicaciones que involucren objetos deformables, fluidos, ensamblaje de alta precisión o operaciones domésticas no estructuradas, los datos del mundo real — especialmente las demostraciones expertas de alta calidad — siguen siendo insustituibles.

¿Qué significa esto para los proveedores de datos? Las oportunidades comerciales entre 2026 y 2028 estarán en soluciones híbridas que combinen grandes volúmenes de datos sintéticos con trayectorias reales seleccionadas, especialmente en áreas «difíciles» como telas, líquidos, escenas caóticas y razonamiento en múltiples pasos. En el futuro previsible, los datos sintéticos por sí solos no serán suficientes para soportar despliegues en producción.

Epílogo: de «qué conjunto de datos» a «cómo mezclar»

La convergencia de OXE, LeRobot y InternData-A1 marca el fin real de la era de fragmentación de datos en el aprendizaje robótico. Hemos entrado en una fase de «pos-conjunto de datos», donde las preguntas clave ya no son «¿cuál conjunto de datos?» sino:

  • ¿Cómo mezclar de forma más efectiva datos reales, sintéticos y destilados?
  • ¿Cómo diseñar metadatos que sobrevivan en la destilación del modelo?
  • ¿Qué fenómenos físicos y de forma corporal siguen siendo los cuellos de botella principales?

Los próximos 2-3 años, los ganadores serán aquellos que puedan producir datos de alta calidad, cumplir con los estándares y mantener ventajas en las áreas «más difíciles» que aún requieren recopilación de datos reales.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)