Google DeepMind lanza Gemini Robotics-ER 1.6, el robot Spot ya puede leer paneles de instrumentos automáticamente

robot
Generación de resúmenes en curso

Noticias de ME News, 14 de abril (UTC+8), según la monitorización de 1M AI News, Google DeepMind lanzó Gemini Robotics-ER 1.6, diseñado como un modelo de razonamiento de alto nivel para robots, con mejoras significativas en razonamiento espacial y comprensión de múltiples perspectivas en comparación con las versiones anteriores ER 1.5 y Gemini 3.0 Flash. El modelo ya está disponible para desarrolladores a través de Gemini API y Google AI Studio. Las mejoras principales incluyen tres capacidades: 1. Mejora en la precisión de apuntar: útil para detección precisa de objetos, conteo, razonamiento de relaciones espaciales (como “indicar todos los objetos que caben en una taza azul”) y planificación de trayectorias, además de poder rechazar correctamente objetos que no están en la imagen 2. Detección exitosa desde múltiples perspectivas: el robot ahora puede determinar si una tarea está completa combinando las imágenes de varias cámaras, manteniendo precisión incluso en entornos con obstáculos o en movimiento 3. Nueva capacidad de lectura de instrumentos: capaz de interpretar diversos instrumentos industriales como manómetros circulares, indicadores de nivel vertical y pantallas digitales, mediante agentic vision (razonamiento visual + ejecución de código) para realizar un razonamiento paso a paso, primero ampliando áreas de detalle, luego usando apuntar y cálculos de código para determinar proporciones y distancias, y finalmente combinando conocimientos del mundo para obtener la lectura La capacidad de lectura de instrumentos proviene de la colaboración entre DeepMind y Boston Dynamics. El mismo día, Boston Dynamics anunció que ha integrado Gemini y Gemini Robotics-ER 1.6 en su producto Orbit AIVI-Learning, lanzándolo a todos los clientes de AIVI-Learning el 8 de abril. Tras la integración, se añadió soporte para paneles de instrumentos (gauges), permitiendo que el robot cuadrúpedo Spot realice inspecciones autónomas en instalaciones industriales y lea datos de instrumentos como manómetros. Boston Dynamics afirmó que, gracias a la capacidad de razonamiento de Gemini, el rendimiento y la precisión en tareas como inspección visual, conteo de paletas y detección de líquidos acumulados también han mejorado en su línea base. DeepMind afirma que ER 1.6 es su “modelo de robot más seguro”. En tareas de razonamiento espacial adverso, cumple con instrucciones de seguridad mucho mejor que ER 1.5. En pruebas de identificación de riesgos de seguridad basadas en informes reales de lesiones, los modelos de la serie ER superaron en un 6% en escenarios de texto y en un 10% en escenarios de video en comparación con Gemini 3.0 Flash. (Fuente: BlockBeats)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado