Nvidia lanza el modelo de código abierto más potente Nemotron 3 Ultra! Enfocado en tareas de agentes de IA, rendimiento aumentado 5 veces, reducción de costos del 30%

El gigante de chips NVIDIA anunció hoy (4) el lanzamiento de su nuevo modelo insignia de código abierto, "Nemotron 3 Ultra".
Este modelo está diseñado específicamente para agentes de IA de larga duración y flujos de trabajo complejos con múltiples agentes, con un total de hasta 550 mil millones de parámetros.
Mediante la incorporación de arquitecturas híbridas y varias innovaciones tecnológicas, Nemotron 3 Ultra no solo sobresale en múltiples pruebas de referencia, sino que también ofrece hasta 5 veces más rendimiento, además de reducir en un 30% los costos de tareas de agentes.
(Resumen previo: ¡Nvidia invierte 400 millones de dólares en la adquisición de Kumo AI! Completa el rompecabezas de los "modelos predictivos empresariales" y acelera su transformación en un gigante de IA de extremo a extremo)
(Información adicional: Nvidia se alía con la startup china Yushu Technology Unitree! Jensen Huang impulsa una "plataforma de IA para robots humanoides", apuntando al mercado físico de IA de decenas de billones de dólares)

Índice del artículo

Alternar

  • 550 mil millones de parámetros activos, convirtiéndose en el "cerebro" del flujo de trabajo de IA
  • Cinco innovaciones tecnológicas principales: aumento de 5 veces en rendimiento, reducción de costos del 30%
  • Completamente de código abierto, acelerando la implementación de aplicaciones de IA a nivel empresarial

En la tendencia de la inteligencia artificial (IA) hacia una automatización avanzada y flujos de trabajo complejos, los costos computacionales y los cuellos de botella en eficiencia de los "sistemas multi-agente" se han convertido en los mayores obstáculos para las empresas al adoptar IA.
Para resolver estos problemas, NVIDIA lanzó oficialmente el 4 de junio de 2026 la familia de productos insignia Nemotron 3 — Nemotron 3 Ultra.

Este es un modelo de código abierto potente, diseñado específicamente para "agentes de IA de larga duración".
En los flujos de trabajo tradicionales de múltiples agentes, debido a la necesidad de repetir continuamente la planificación, llamar a herramientas, delegar sub-agentes y mantener contextos extensos, a menudo se produce un aumento exponencial en el consumo de tokens, lo que genera costos elevados y riesgos de desviación de objetivos, y Nemotron 3 Ultra fue creado para superar estos desafíos.

550 mil millones de parámetros activos, convirtiéndose en el "cerebro" del flujo de trabajo de IA

Nemotron 3 Ultra utiliza una arquitectura de expertos híbridos (Mixture-of-Experts, MoE), con un total de 5500 mil millones de parámetros, pero solo activa 550 mil millones en cada operación, asegurando una eficiencia máxima.
En los flujos de trabajo de múltiples agentes, este modelo se posiciona con precisión como "orquestador" o motor de inferencia avanzado, especializado en tareas de planificación profunda, análisis complejo y verificación lógica de alta carga, delegando tareas rutinarias y llamadas a herramientas a modelos ligeros.

En términos de rendimiento, Nemotron 3 Ultra ha destacado en varias pruebas de referencia centradas en agentes de IA.
Por ejemplo, obtuvo un 91% en productividad de agentes (PinchBench), y logró un rendimiento del 40% y 67% en planificación a largo plazo (EnterpriseOps-Gym) y codificación (Terminal-Bench 2.0), respectivamente.
Aunque activa menos parámetros, su capacidad de inferencia general ha superado o igualado a modelos de código abierto líderes en el mercado como GLM 5.1, Kimi K2.6 y Qwen3.5.

Cinco innovaciones tecnológicas principales: aumento de 5 veces en rendimiento, reducción de costos del 30%

Para lograr un rendimiento y velocidad tan impresionantes, NVIDIA incorporó cinco innovaciones clave en Nemotron 3 Ultra.
Primero, la "capa híbrida Mamba-Transformer", que combina hábilmente la eficiencia en procesamiento de secuencias largas de Mamba con la capacidad de recuperación de hechos precisos del Transformer.
En segundo lugar, soporta "cuantificación NVFP4", permitiendo que los pesos del modelo se implementen sin problemas en GPUs con arquitecturas Hopper, Blackwell y Ampere, y en comparación con el formato BF16 tradicional, en Blackwell puede aumentar hasta 5 veces el rendimiento (velocidad de salida).

Además, el modelo integra LatentMoE (una ruta de expertos eficiente para cargas de trabajo complejas), predicción de múltiples tokens (MTP, que predice varios tokens futuros en una sola pasada para acelerar la generación de textos largos), y destilación en línea multi-docente (MOPD), entre otras tecnologías de vanguardia.
Estas innovaciones reducen significativamente el consumo total de tokens durante la tarea, disminuyendo en hasta un 30% los costos de tareas de los agentes para las empresas.

Completamente de código abierto, acelerando la implementación de aplicaciones de IA a nivel empresarial

En cuanto a datos de entrenamiento, Nemotron 3 Ultra se basa en una base de entrenamiento masiva de más de 10 billones de tokens, además de incorporar más de 212 mil millones de tokens específicos de dominio (incluyendo documentos legales, textos estilo Wikipedia y el código más reciente de GitHub).
NVIDIA enfatiza que el modelo es completamente de código abierto, con una licencia OpenMDW-1.1 altamente flexible, y que pone a disposición de la comunidad los pesos del modelo, las recetas de entrenamiento y los pipelines de datos.

Actualmente, los desarrolladores pueden acceder y desplegar Nemotron 3 Ultra en plataformas principales como Hugging Face, NVIDIA Build y NIM.
Con su excepcional capacidad para manejar textos largos (alcanzando un 95% en la prueba Ruler @1M) y su alta rentabilidad, se espera que este modelo sea una herramienta excelente para impulsar la automatización del servicio al cliente, gestión de la cadena de suministro, protección de seguridad informática y validación de diseño de chips en aplicaciones prácticas complejas.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado