Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
CFD
Derivados de CFD de acciones estadounidenses
Acciones EE. UU.
Accede a acciones y ETF estadounidenses reales
Acciones HK
Opera con acciones de calidad cotizadas en Hong Kong
Acciones surcoreanas
SK Hynix
Opera con acciones surcoreanas reales e invierte en activos populares
Futuros de acciones
Alto apalancamiento, trading 24/7
Acciones tokenizadas
Respaldado por acciones reales
IPO Access
Accede al acceso completo a las OPV de acciones globales
GUSD
Acuña GUSD para obtener rendimientos de RWA del Tesoro
Actividades de acciones
Opera con acciones populares y desbloquea grandes airdrops
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
IPO Access
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gate Wealth
Toma el control del futuro financiero
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
USD1 8% TAE
Sin bloqueo, opera y retira.
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
¡El momento Skill de la inteligencia incorporada! NVIDIA lanza código abierto de biblioteca de habilidades robóticas, Jim Fan: el paradigma ha cambiado.
¡6! Los robots también pueden aprender habilidades.
Justo ahora, NVIDIA ha lanzado una biblioteca de habilidades que permite a los robots crecer continuamente:
ASPIRE.
En términos simples, ASPIRE es como un Agente de Codificación para robots.
Al igual que GPT puede convertir tus prompts y registros de trabajo en habilidades reutilizables, ASPIRE también consolida los fracasos y reparaciones del robot en experiencias que pueden ser invocadas posteriormente.
La diferencia es que no revisa código, sino el proceso de operación del robot.
Cada vez que el robot ejecuta una tarea, ASPIRE registra procesos como percepción, navegación, agarre, colisión y planificación de movimiento.
El GPT/Claude que utiliza internamente actúa como un investigador, evaluando dónde falló la tarea e iterando el programa. Si la tarea se completa con éxito, la experiencia consolidada se escribe en una Skill.
De esta manera, el robot puede aprender continuamente escribiendo código, viendo trayectorias de ejecución, reparando programas y acumulando habilidades.
Y esto no se limita solo a refinar habilidades a partir de la experiencia del robot.
Jim Fan, director de robótica de NVIDIA, también señaló que ASPIRE representa un nuevo paradigma de aprendizaje continuo.
Entre ellos:
Lo que se entrena no son necesariamente pesos
Aunque ya se ha introducido lo esencial, antes de explicar cómo revoluciona el paradigma de entrenamiento de robots, repasemos un poco de contexto.
El nombre completo de ASPIRE es Agentic Skill Programming through Iterative Robot Exploration.
Permite que los robots ejecuten tareas mediante código. Tras un fallo, el robot observa las trayectorias multimodales de ejecución, repara el programa y almacena la experiencia reparada en una biblioteca de habilidades (skills library) que se va enriqueciendo.
Aquí, una Skill, aunque en esencia sigue siendo un contexto alimentado a un modelo grande, contiene un patrón de reparación de código verificado (Code Repair Pattern), que indica al robot cómo modificar el programa de control cuando se enfrenta a cierto tipo de problemas.
Por ejemplo, cuando un robot intenta recoger una radio, ya ha identificado el objetivo pero no puede acercarse.
El Agente puede analizar que la causa no es un error de reconocimiento, sino que los puntos objetivo proporcionados por el planificador (Planner) caen dentro del búfer de colisión de obstáculos.
A partir de esta experiencia, ASPIRE sintetiza una nueva Skill:
En el futuro, ante escenarios similares, ya sea la radio, un microondas u otros muebles, esta experiencia se puede reutilizar directamente sin necesidad de volver a probar y errar.
Al llegar a este punto, quizás te preguntes: ¿no debería el entrenamiento de robots implicar datos, descenso de gradiente, pesos de modelos, recolección en entornos reales y transferencia de simulación a realidad?
¿Por qué de repente se convierte en acumular habilidades?
Aquí hay que mencionar un paradigma reciente muy popular: Code as Policy.
A diferencia de los modelos de políticas extremo a extremo como VLA, Code as Policy no hace que el modelo genere directamente las acciones del robot, sino que permite que un modelo grande escriba un programa de control robótico ejecutable.
El programa puede invocar módulos de percepción, API de planificación y primitivas de control, como reconocer objetos, planificar trayectorias, mover un brazo robótico y ejecutar agarres.
De esta manera, el comportamiento del robot ya no está completamente oculto en los pesos de la red neuronal, sino que se convierte en código de operación ejecutable.
Una vez que hay código, puede ser revisado, modificado, depurado y optimizado por los poderosos modelos Agente actuales.
Pero en el pasado, Code as Policy tenía dos problemas.
Primero, cuando un robot fallaba, el sistema generalmente solo sabía que "la tarea no se completó", pero no si el error era de percepción, agarre inestable, colisión en la planificación de trayectoria o un problema en la acción de recuperación.
Segundo, y más crucial, no recordaba.
Después de completar una tarea, las soluciones de reparación, estrategias de recuperación y redacción de prompts descubiertas durante la depuración se descartaban. La próxima vez que se enfrentara a un problema similar, tenía que empezar desde cero.
Esta es la razón por la que Jim Fan dijo:
En resumen, todo este proceso es igual que el de un ingeniero humano en robótica:
Cuando un programa de robot falla, el ingeniero reproduce el proceso de ejecución, observa los resultados de percepción, analiza la trayectoria de movimiento y determina si el error fue de agarre, planificación o una acción de recuperación no conectada.
Después de repararlo, el ingeniero registra la experiencia. La próxima vez que se enfrente a objetos cercanos a una mesa, manijas de cajones o navegación en espacios estrechos, no empezará desde cero.
Lo que ASPIRE hace es delegar este mecanismo de acumulación de experiencia al agente. No solo permite que el modelo grande escriba código para robots, sino que también permite que el modelo grande pruebe, observe y repare repetidamente en el entorno de ejecución, y finalmente consolide las experiencias de reparación verificadas como Skills.
Por lo tanto, en ASPIRE, el entrenamiento ya no es solo descenso de gradiente.
El proceso de entrenamiento se convierte en Refinamiento de Habilidades (Skill Refinement); el producto del entrenamiento no es solo un peso de modelo, sino una Biblioteca de Habilidades (Skills Library) que el robot acumula y desarrolla continuamente.
Pipeline de tres etapas
En el artículo, esta idea se implementa como un pipeline de tres etapas.
Primero está el motor de ejecución del robot (robot execution engine).
Cuando un programa de robot tradicional falla, el sistema puede indicar solo que la tarea no se completó.
ASPIRE desglosa el fallo: cada percepción, planificación, agarre y llamada de control deja entradas, salidas, evidencia visual y registros de error.
Al igual que un ingeniero humano que al depurar un robot reproduce el video, observa la trayectoria y verifica si el error fue de percepción o de agarre, ASPIRE le asigna esta tarea al agente de codificación.
A continuación viene la biblioteca de habilidades (skill library). Una vez que el agente repara el programa, no descarta la experiencia, sino que la convierte en conocimiento reutilizable.
En la biblioteca de habilidades del sitio web se pueden ver elementos muy específicos, como cómo redactar prompts de texto de SAM3, cómo acercarse a objetos en el borde de una mesa desde múltiples ángulos, cómo filtrar falsas detecciones en manijas de cajones, qué primitivas de movimiento usar al empujar objetos planos.
Estos no son como los pesos de modelos tradicionales; son más como las notas de errores de un programador de robots.
Finalmente está la búsqueda evolutiva (evolutionary search).
Un agente no solo prueba una única ruta de reparación, sino que el sistema genera múltiples programas de control candidatos, los ejecuta en el entorno, y luego itera basándose en los programas supervivientes y las trayectorias de fallo.
En ingeniería de software, los agentes de codificación ya están acostumbrados a escribir código, ejecutar pruebas, ver trazas y corregir errores. Lo que ASPIRE hace es trasladar este ciclo al mundo físico.
Verificación experimental
Para verificar este método, el artículo realizó pruebas en tres benchmarks robóticos clásicos: LIBERO-Pro, Robosuite y BEHAVIOR-1K, que cubren operaciones de generalización, operaciones intensivas en contacto y tareas domésticas de larga duración.
Los resultados globales fueron claramente mejores que los métodos anteriores de Code as Policy.
Por ejemplo, en la tarea de transferencia bimanual de objetos (Bimanual Handover) en Robosuite, ASPIRE aumentó la tasa de éxito del 20% al 92%.
En cuanto a la capacidad de generalización.
El estudio primero acumuló la Skill Library en LIBERO-90, y luego la transfirió directamente a la tarea larga LIBERO-Pro Long, que nunca había visto, sin entrenamiento adicional para la nueva tarea ni actualización de la biblioteca de habilidades.
Los resultados muestran que a medida que la biblioteca de habilidades se enriquece, la tasa de éxito del robot en nuevas tareas también aumenta, desde casi no poder hacer nada hasta alcanzar el 31%. En otras palabras, cuanto más gruesa es la Skill Library, menos parece el robot un novato.
Introducción a los autores
Al final del blog técnico, NVIDIA también publicó la lista completa de autores.
Siguen siendo caras conocidas del equipo GEAR: Jim Fan, Zhu Yuke, Guanzhi Wang, Shi Guangya, entre otros.
Los tres primeros autores tienen contribuciones conjuntas.
Entre ellos, Runyu Lu es actualmente estudiante de doctorado de segundo año en la Universidad de Michigan, realizando prácticas en GEAR; Yuubo Wu proviene de la Universidad de Illinois en Urbana-Champaign (UIUC); Ethan Kou proviene de la Universidad de California, Berkeley, y actualmente es estudiante de pregrado.
Vale la pena mencionar que, justo ayer, NVIDIA también anunció la expansión de la contratación de su equipo de robótica en China, abriendo múltiples puestos en Beijing, Shanghái y Shenzhen, cubriendo direcciones como cognición encarnada, simulación, despliegue de robots y arquitectura de soluciones.
Fuente del artículo: Quantum Bit
Advertencia de riesgos y exención de responsabilidad
El mercado tiene riesgos, invierta con precaución. Este artículo no constituye un consejo de inversión personal, ni considera los objetivos de inversión, situación financiera o necesidades específicas de usuarios individuales. Los usuarios deben considerar si las opiniones, puntos de vista o conclusiones presentados en este artículo se ajustan a sus circunstancias particulares. Cualquier inversión basada en esto es responsabilidad del propio inversor.