黄仁勋:Necesitamos más tokens y ingenieros, este es el acto de apertura de la revolución de la IA

robot
Generación de resúmenes en curso

Netease News (Sun Yingxin) sigue vistiendo su chaqueta de cuero negro con el mismo espíritu, y sigue siendo ese viejo Huang lleno de energía y que habla con entusiasmo.

17 de marzo, en la conferencia GTC 2026 inaugurada en San José, California (EE. UU.), el fundador y CEO de NVIDIA, Huang Renxun, dio inicio a su muy esperada charla magistral sobre el tema central. Los espectadores que vienen a ver su discurso necesitan hacer cola; en el lugar había gente por todas partes. Esta presentación no solo incluyó un repaso de Huang Renxun sobre los avances tecnológicos acumulados durante las últimas dos décadas, sino también su declaración entusiasta y visionaria sobre los planos futuros para el desarrollo de la IA, como si quisiera poner la corona de la Era del Token en la cabeza de alguien.

“Bienvenidos a la GTC. Solo quiero recordarte que esto es una conferencia de tecnología… Vamos a hablar de tecnología, vamos a hablar de plataformas”. A continuación, Huang Renxun, sin pausas, dedicó dos horas para anunciar que la era de la inferencia de la IA ya ha llegado por completo. Old Huang señaló que la inteligencia artificial ya había pasado de la simple fase de entrenamiento a una nueva era de inferencia y acción. En esta etapa, la IA deja de ser solo algo que entiende el mundo, y empieza a pensar, planificar y ejecutar tareas.

Motor de billones: Fábricas de Token y revolución del costo de cómputo

Cuando hay algo grande, hay que ponerse la chaqueta de cuero. En esta edición de la conferencia, Old Huang presentó con fuerza una explicación profunda sobre los conceptos de cómputo a escala de billones y fábricas de Token. Predijo con valentía que, en 2027, la demanda global de cómputo de IA alcanzará al menos 1 billón de dólares; este número supera con creces la predicción anterior de 500.000 millones de dólares, y marca que la industria entra oficialmente en una fase de crecimiento multiplicado por millones. Combinando esta predicción previa de Old Huang sobre que el cómputo es comparable a la Ley de Moore, se puede creer que el número de demanda global de cómputo de IA no es más que el comienzo.

Old Huang planteó una perspectiva subversiva: los centros de datos se están transformando desde instalaciones tradicionales de almacenamiento en bases de producción de Token. “El Token se convierte en la nueva materia prima importante; el rendimiento de inferencia determina los ingresos”. Cree que, bajo este nuevo paradigma, la producción de los centros de datos ya no serán datos estáticos, sino Token generados de manera dinámica. La cantidad de Token que se puede generar por cada vatio de electricidad determina directamente la capacidad de ingresos de las empresas.

Para ilustrar este punto, Old Huang también dio un ejemplo propio y reveló la impresionante eficacia de la nueva plataforma Rubin. Esta plataforma incrementa hasta diez veces el rendimiento de la capa de mayor valor de Token por unidad; además, viene acompañada de un salto en eficiencia: en una escala de centro de datos de 1GW, la tasa de generación de Token alcanzará un crecimiento de 350 veces en dos años.

Hasta aquí, Old Huang también aprovechó para hacer un poco de publicidad y subrayó la importancia de la eficiencia de la arquitectura. “Si eliges mal la arquitectura, aunque sea gratis, igual no sale rentable”. Luego explicó que, aunque construir un centro de datos a nivel de gigavatio requiere unos 40.000 millones de dólares, solo al seleccionar la arquitectura óptima (esa es la arquitectura de quién, ya sabes) se puede asegurar que esa gran inversión se convierta en el costo de producción de Token más competitivo.

Old Huang dice esto con fundamento, porque en aquel entonces él mismo embaló y envió el primer DGX-1, con un valor de 300.000 dólares, a la oficina de OpenAI, que en ese momento aún no era conocida por mucha gente, entregándosela al equipo de Ilya Sutskever; más tarde, esa máquina se convirtió en la cuna del cómputo para la serie GPT.

Y ahora, nueve años después, con el mismo costo de cómputo de 1 PFLOPS, ya pasó de decenas de cientos de miles de dólares a solo unos miles de dólares, y el volumen se redujo de tamaño de servidor a tamaño de un libro. Incluso Old Huang siente: “La velocidad con la que disminuye el costo del cómputo es incomparable con cualquier tecnología en la historia de la humanidad”.

Tormenta de agentes: el auge de OpenClaw y un nuevo paradigma para el trabajo

Antes hablamos de la declaración desenfrenada de Old Huang, como si quisiera poner la corona de la Era del Token en la cabeza de alguien. Ahora esta escena se vuelve aún más concreta. Frente a los temas candentes de la IA del momento, no escatimó elogios para OpenClaw y lanzó múltiples argumentos revolucionarios sobre, entre otras cosas, los agentes inteligentes de la IA, sacudiendo a toda la industria.

Old Huang tiene mucha confianza en OpenClaw, lo llama “el sistema operativo de la computadora de agentes”, e incluso afirma: “El logro de OpenClaw al superar en pocas semanas los 30 años de Linux”. Señaló que OpenClaw no es solo un proyecto de código abierto, sino también la pieza central que conecta grandes modelos, herramientas, el sistema de archivos y capacidades de programación. Permite que cada agente inteligente de IA tenga capacidades independientes de administración de recursos y ejecución de tareas, igual que una computadora personal ejecuta Windows.

Luego, Old Huang habló sobre SaaS; con la popularización de OpenClaw, planteó audazmente la “teoría de la desaparición de SaaS”: “Todos los SaaS se convertirán en AaaS (Agente como servicio)”. Y expresó que en el futuro las empresas de software ya no solo proporcionarán herramientas para que las personas las usen, sino agentes capaces de ejecutar tareas de forma autónoma. Las empresas deben definir su propia estrategia de OpenClaw, igual de clave que en su momento definir la estrategia de Linux o HTTP.

Si esto fuera todo, sería subestimar la capacidad de Old Huang para dar justo en el corazón. A continuación, lanzó una perspectiva aún más prospectiva sobre la transformación del sistema de compensación para ingenieros, describiendo así el panorama del empleo futuro: “Los ingenieros recibirán salario anual + presupuesto de Token; el Token se convertirá en un recurso central para la eficiencia”. Es decir, en el futuro, los ingresos de los ingenieros se compondrán de dos partes: salario base y presupuesto de Token. Los ingenieros que puedan utilizar eficientemente el presupuesto de Token verán amplificada su productividad diez veces. El presupuesto de Token incluso ya se ha convertido en una nueva herramienta de reclutamiento en Silicon Valley: “¿Cuántos Tokens vendrán adjuntos a mi tarea?” será la pregunta más importante para quienes buscan empleo.

Dijo esto también con experiencia personal: Old Huang mencionó un asunto curioso que ocurrió hace tiempo. Un Huang Renxun falso generado por IA, durante la transmisión en vivo de la GTC, habló sobre criptomonedas falsas, y sin embargo su audiencia llegó a 100.000; fue 5 veces el número de espectadores de la transmisión oficial. Después se burló: “Hasta mis avatares de IA están compitiendo por el ‘calor’ del cómputo”.

Grandioso plan de ecosistema: rueda motriz de CUDA y avanzar con luz, retroceder con cobre

Old Huang, como siempre, vestía su chaqueta de cuero; eso demuestra que también es alguien que se aferra al pasado. En la conferencia, Old Huang dedicó más de 20 minutos para repasar la estrategia de ecosistema de NVIDIA.

“Necesitamos crear mercados para el futuro, no servir a los mercados existentes”. A lo largo de su repaso, Old Huang contó la trayectoria de CUDA: desde cuando se burlaban de ella como un juguete para científicos, hasta convertirse hoy en una base para la IA.

En la hoja de ruta de tecnologías de hardware, Old Huang señaló de manera clara la tendencia de “avanzar con la luz y retroceder con el cobre”: “El cobre ya murió; la luz es el futuro del cómputo”. En la plataforma Rubin más reciente, CPO (encapsulado óptico con co-empaque), una tecnología que puede reducir drásticamente el consumo de energía por puerto y resolver el cuello de botella de consumo de energía en las conexiones de alta velocidad. Mediante la tecnología de proceso COUPE, inventada conjuntamente con TSMC, los interfaces ópticos se incrustan directamente en el chip, logrando una mejora revolucionaria de eficiencia energética.

Todos estos logros apuntan a un objetivo: una fábrica de IA. Old Huang reiteró su definición central: “Todas las empresas deben construir fábricas de IA; la competitividad se mide por la eficiencia de las fábricas de IA”. Cree que la competencia futura de las empresas ya no será solo una competencia de tecnología o de talento, sino de quién puede generar Tokens con menor costo y mayor eficiencia.

“La inferencia se ha vuelto realidad; los robots nacen para la IA; y en este momento, ¡griten fuerte lo que necesitan: más Tokens! ¡Ingenieros de IA! ¡Todos en su puesto!” “Esta no es solo una conferencia; es el acto de inicio de la revolución industrial de la inteligencia artificial.”

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado