Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 40 modelos de IA, con 0% de costos adicionales
Nvidia lanza el modelo de código abierto más potente Nemotron 3 Ultra! Enfocado en tareas de agentes de IA, rendimiento aumentado 5 veces, reducción de costos del 30%
El gigante de chips NVIDIA anunció hoy (4) el lanzamiento de su nuevo modelo insignia de código abierto, "Nemotron 3 Ultra".
Este modelo está diseñado específicamente para agentes de IA de larga duración y flujos de trabajo complejos con múltiples agentes, con un total de hasta 550 mil millones de parámetros.
Mediante la incorporación de arquitecturas híbridas y varias innovaciones tecnológicas, Nemotron 3 Ultra no solo sobresale en múltiples pruebas de referencia, sino que también ofrece hasta 5 veces más rendimiento, además de reducir en un 30% los costos de tareas de agentes.
(Resumen previo: ¡Nvidia invierte 400 millones de dólares en la adquisición de Kumo AI! Completa el rompecabezas de los "modelos predictivos empresariales" y acelera su transformación en un gigante de IA de extremo a extremo)
(Información adicional: Nvidia se alía con la startup china Yushu Technology Unitree! Jensen Huang impulsa una "plataforma de IA para robots humanoides", apuntando al mercado físico de IA de decenas de billones de dólares)
Índice del artículo
Alternar
En la tendencia de la inteligencia artificial (IA) hacia una automatización avanzada y flujos de trabajo complejos, los costos computacionales y los cuellos de botella en eficiencia de los "sistemas multi-agente" se han convertido en los mayores obstáculos para las empresas al adoptar IA.
Para resolver estos problemas, NVIDIA lanzó oficialmente el 4 de junio de 2026 la familia de productos insignia Nemotron 3 — Nemotron 3 Ultra.
Este es un modelo de código abierto potente, diseñado específicamente para "agentes de IA de larga duración".
En los flujos de trabajo tradicionales de múltiples agentes, debido a la necesidad de repetir continuamente la planificación, llamar a herramientas, delegar sub-agentes y mantener contextos extensos, a menudo se produce un aumento exponencial en el consumo de tokens, lo que genera costos elevados y riesgos de desviación de objetivos, y Nemotron 3 Ultra fue creado para superar estos desafíos.
550 mil millones de parámetros activos, convirtiéndose en el "cerebro" del flujo de trabajo de IA
Nemotron 3 Ultra utiliza una arquitectura de expertos híbridos (Mixture-of-Experts, MoE), con un total de 5500 mil millones de parámetros, pero solo activa 550 mil millones en cada operación, asegurando una eficiencia máxima.
En los flujos de trabajo de múltiples agentes, este modelo se posiciona con precisión como "orquestador" o motor de inferencia avanzado, especializado en tareas de planificación profunda, análisis complejo y verificación lógica de alta carga, delegando tareas rutinarias y llamadas a herramientas a modelos ligeros.
En términos de rendimiento, Nemotron 3 Ultra ha destacado en varias pruebas de referencia centradas en agentes de IA.
Por ejemplo, obtuvo un 91% en productividad de agentes (PinchBench), y logró un rendimiento del 40% y 67% en planificación a largo plazo (EnterpriseOps-Gym) y codificación (Terminal-Bench 2.0), respectivamente.
Aunque activa menos parámetros, su capacidad de inferencia general ha superado o igualado a modelos de código abierto líderes en el mercado como GLM 5.1, Kimi K2.6 y Qwen3.5.
Cinco innovaciones tecnológicas principales: aumento de 5 veces en rendimiento, reducción de costos del 30%
Para lograr un rendimiento y velocidad tan impresionantes, NVIDIA incorporó cinco innovaciones clave en Nemotron 3 Ultra.
Primero, la "capa híbrida Mamba-Transformer", que combina hábilmente la eficiencia en procesamiento de secuencias largas de Mamba con la capacidad de recuperación de hechos precisos del Transformer.
En segundo lugar, soporta "cuantificación NVFP4", permitiendo que los pesos del modelo se implementen sin problemas en GPUs con arquitecturas Hopper, Blackwell y Ampere, y en comparación con el formato BF16 tradicional, en Blackwell puede aumentar hasta 5 veces el rendimiento (velocidad de salida).
Además, el modelo integra LatentMoE (una ruta de expertos eficiente para cargas de trabajo complejas), predicción de múltiples tokens (MTP, que predice varios tokens futuros en una sola pasada para acelerar la generación de textos largos), y destilación en línea multi-docente (MOPD), entre otras tecnologías de vanguardia.
Estas innovaciones reducen significativamente el consumo total de tokens durante la tarea, disminuyendo en hasta un 30% los costos de tareas de los agentes para las empresas.
Completamente de código abierto, acelerando la implementación de aplicaciones de IA a nivel empresarial
En cuanto a datos de entrenamiento, Nemotron 3 Ultra se basa en una base de entrenamiento masiva de más de 10 billones de tokens, además de incorporar más de 212 mil millones de tokens específicos de dominio (incluyendo documentos legales, textos estilo Wikipedia y el código más reciente de GitHub).
NVIDIA enfatiza que el modelo es completamente de código abierto, con una licencia OpenMDW-1.1 altamente flexible, y que pone a disposición de la comunidad los pesos del modelo, las recetas de entrenamiento y los pipelines de datos.
Actualmente, los desarrolladores pueden acceder y desplegar Nemotron 3 Ultra en plataformas principales como Hugging Face, NVIDIA Build y NIM.
Con su excepcional capacidad para manejar textos largos (alcanzando un 95% en la prueba Ruler @1M) y su alta rentabilidad, se espera que este modelo sea una herramienta excelente para impulsar la automatización del servicio al cliente, gestión de la cadena de suministro, protección de seguridad informática y validación de diseño de chips en aplicaciones prácticas complejas.