Huang Renxun en GTC Taipei 2026 revela una nueva era de "Economía de Tokens": los centros de datos de IA están pasando de vender hardware a un modelo de "cálculo como ingreso", donde cada Token es una unidad de activo que puede ser valorada y rentable. La arquitectura Vera Rubin se produce a gran escala, combinada con Groq LPU para desacoplar la inferencia, permitiendo que los ingresos anuales de un centro de datos de 1GW se disparen de 30 mil millones de dólares a 300 mil millones de dólares. Huang Renxun también anunció la activación de la sede de NVIDIA Constellation en Taipei, donde la demanda de cálculo de IA en Taiwán está "disparándose como un cohete".
(Resumen previo: ¿Huang Renxun en GTC 2026 hablando frenéticamente de "Dureza"? ¿Por qué el Agente LLM necesita endurecerse, una frase que revela la clave para la implementación de IA en la práctica?)
(Información adicional: ¿Creen que ChatGPT y Claude acabarán con todos los trabajos?)

Índice de este artículo

Alternar

Token como ingreso: la fórmula comercial de las fábricas de IA
Vera Rubin en producción masiva: el doble de tamaño en la cadena de suministro
Inferencia desacoplada: NVIDIA + Groq creando un "doble motor de Token"

El CEO de NVIDIA, Huang Renxun, lanzó una declaración impactante en la conferencia GTC Taipei 2026 el 1 de junio: "El Token es un activo, el Token ya se ha convertido en una unidad de ingreso rentable." Él afirmó claramente que la lógica comercial de la industria de IA está cambiando — de vender hardware GPU a vender "resultado de cálculo" en una era.

Este discurso principal, realizado en el Taipei Music Center y sincronizado con COMPUTEX 2026, no solo revisó los anuncios clave en la sede de GTC en San José, sino que también utilizó datos para demostrar: un centro de datos de IA de 1GW, tras la actualización de Blackwell a Vera Rubin con la arquitectura de inferencia desacoplada de Groq, puede aumentar sus ingresos anuales de aproximadamente 30 mil millones de dólares a 300 mil millones de dólares — una historia de "crecimiento diez veces", que hace vibrar a todos los socios de la cadena de suministro.

Token como ingreso: la fórmula comercial de las fábricas de IA

Huang Renxun desglosó sistemáticamente la lógica comercial de la "Economía de Tokens" en su discurso. Señaló que la inferencia de IA ya ha evolucionado de "responder preguntas" a "generar beneficios" — cada Token producido puede corresponder directamente a la disposición de pago del cliente final. Para ello, NVIDIA diseñó cinco modelos de precios de Tokens:

Nivel gratuito: preguntas básicas, atención al cliente
Nivel ligero (aproximadamente 5 dólares por millón de Tokens): generación de contenido, resúmenes
Nivel profesional (aproximadamente 30 dólares por millón de Tokens): generación de código, análisis de datos
Nivel empresarial (aproximadamente 80 dólares por millón de Tokens): cumplimiento normativo, modelado financiero
Nivel premium (aproximadamente 150 dólares por millón de Tokens): investigación científica, descubrimiento de fármacos, inferencia en tiempo real

"Hacer dinero con cada Token, las empresas de IA querrán construir más Tokens, generar más Tokens, y producir más fábricas de IA." Huang Renxun enfatizó que esta es la razón por la cual la demanda de cálculo en Taiwán ya está "disparándose como un cohete" — cuando el cálculo equivale directamente a ingresos, ampliar los centros de datos se vuelve una consecuencia inevitable.

Vera Rubin en producción masiva: el doble de tamaño en la cadena de suministro

Como uno de los lanzamientos de hardware más destacados en GTC 2026, la arquitectura Vera Rubin ha entrado oficialmente en producción masiva. Huang Renxun reveló que la cadena de suministro de Vera Rubin es el doble del tamaño de la generación anterior, Grace Blackwell, con más de 150 socios en Taiwán participando en ella.

El gabinete insignia Vera Rubin NVL72 integra 72 GPUs Rubin y 36 CPUs Vera, con un diseño de refrigeración líquida al 100%, permitiendo desplegar modelos de IA a gran escala en un solo gabinete. Huang también presentó por primera vez la hoja de ruta de la arquitectura Feynman, que se espera impulse aún más el rendimiento de inferencia y la eficiencia energética.

Es importante destacar que, al final de su discurso, Huang insinuó que habrá "sorpresas en nuevos productos" en la segunda mitad del año, generando altas expectativas en el mercado sobre nuevos productos como GPU para consumo, chips para automoción, etc.

Inferencia desacoplada: NVIDIA + Groq creando un "doble motor de Token"

Huang Renxun mencionó especialmente la estrategia de colaboración con Groq, pionero en LPU (Unidad de Procesamiento de Lenguaje). A diferencia de las GPU, que son excelentes en cálculos paralelos masivos, las tres chips LPX de Groq, fabricados por Samsung y con envío previsto para el tercer trimestre, están especializados en escenarios de "latencia mínima para solicitudes individuales" — en tareas de inferencia en tiempo real que requieren respuestas en milisegundos, el rendimiento de la LPU de Groq supera ampliamente al de las GPU tradicionales.

Huang explicó el poder comercial de la "inferencia desacoplada" con una fórmula sencilla:

Generación Blackwell: centro de datos de 1GW con ingresos anuales de aproximadamente 30 mil millones de dólares
Generación Vera Rubin: con el mismo consumo de energía, ingresos anuales de hasta 150 mil millones de dólares (5 veces más)
Vera Rubin + inferencia desacoplada con Groq: ingresos anuales alcanzan 300 mil millones de dólares (10 veces más)

Los centros de datos están pasando de ser lugares de entrenamiento de modelos a convertirse en fábricas de producción de Tokens.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
IntroducingGateStocks
34.5M Popularidad
#
WinGoldBarsWithGrowthPoints
1.25M Popularidad
#
IsraelStrikesIranBTCPlunges
51.75K Popularidad
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularidad
#
USIranNegotiationGame
9.57M Popularidad

Fijado

黃仁勳 GTC 2026 revela «Economía de Tokens»: cálculo como ingreso, Nvidia inicia producción en masa de Vera Rubin, y la demanda de IA en Taiwán se dispara como un cohete

Token como ingreso: la fórmula comercial de las fábricas de IA

Vera Rubin en producción masiva: el doble de tamaño en la cadena de suministro

Inferencia desacoplada: NVIDIA + Groq creando un "doble motor de Token"

Temas de actualidad

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Fijado