CEO de NVIDIA 黄仁勋publica último artículo firmado: El "pastel de cinco capas" de la IA

robot
Generación de resúmenes en curso

AI es una de las fuerzas poderosas que moldean el mundo actual. No es solo una aplicación ingeniosa, ni un modelo único, sino una infraestructura esencial, como la electricidad y el internet.

AI funciona sobre hardware real, energía y sistemas económicos. Puede transformar materias primas a gran escala en inteligencia. Cada empresa aplicará AI, y cada país o región desarrollará AI.

Para entender por qué AI se desarrolla de esta manera, debemos razonar desde principios básicos y comprender los cambios fundamentales que han ocurrido en el campo de la computación.

De software predefinido a inteligencia en tiempo real

En la historia del desarrollo tecnológico, el software solía estar preconstruido. Los humanos describían un algoritmo, y la computadora lo ejecutaba. Los datos debían ser cuidadosamente diseñados, almacenados en tablas y recuperados mediante consultas precisas. SQL se volvió indispensable porque el mundo de entonces funcionaba así.

AI rompe este esquema.

Por primera vez, tenemos una computadora capaz de entender información no estructurada. Puede reconocer imágenes, leer textos, escuchar sonidos y comprender su significado. Puede razonar según el contexto y la intención. Lo más importante, puede generar inteligencia en tiempo real.

Cada respuesta es completamente nueva. Cada respuesta depende del contexto que proporcionas. No se trata de instrucciones almacenadas que la software recupera, sino de que el software razona y genera inteligencia según la demanda.

Dado que la inteligencia se genera en tiempo real, toda la arquitectura computacional detrás debe ser rediseñada.

AI como infraestructura

Desde una perspectiva industrial, la arquitectura de AI puede descomponerse en cinco capas.

Energía

La capa más baja es la energía. La inteligencia generada en tiempo real requiere energía que también se produce en tiempo real. Cada token generado resulta del flujo de electrones, la gestión del calor y la conversión de energía en cálculos. No hay capas abstractas debajo de esta. La energía es el principio fundamental de la infraestructura de AI y el cuello de botella que limita cuánto puede producirse de inteligencia.

Chips

Sobre la energía están los chips. Estos procesadores están diseñados para convertir energía en capacidad de cálculo a gran escala de manera eficiente. Las cargas de trabajo de AI necesitan procesamiento paralelo masivo, memoria de alta banda ancha y conexiones rápidas. El avance en los chips determina la velocidad de expansión de AI y la aplicabilidad de la inteligencia.

Infraestructura

Encima de los chips está la capa de infraestructura. Esto incluye tierra, suministro eléctrico, sistemas de refrigeración, construcción, redes de comunicación y sistemas que orquestan miles de procesadores en una sola máquina. Estas son las fábricas de AI. No están diseñadas solo para almacenar información, sino para fabricar inteligencia.

Modelos

Sobre la infraestructura está la capa de modelos. Los modelos de AI pueden entender diversos tipos de información: lenguaje, biología, química, física, finanzas, medicina y el mundo físico en sí. Los modelos de lenguaje son solo una categoría. Algunos de los trabajos más revolucionarios ocurren en áreas como AI de proteínas, AI química, simulaciones físicas, robótica y sistemas autónomos.

Aplicaciones

En la capa superior se encuentran las aplicaciones, donde se genera valor económico, como plataformas de descubrimiento de fármacos, robots industriales, asistentes legales, vehículos autónomos, etc. Los vehículos autónomos son una manifestación concreta de la aplicación de AI. Los robots humanoides representan la aplicación física de AI. La misma arquitectura puede dar resultados muy diferentes.

Esta es la estructura de cinco capas:

Energía → Chips → Infraestructura → Modelos → Aplicaciones.

Cada aplicación exitosa impulsa cada capa inferior, hasta la fuente de energía que las mantiene en funcionamiento.

Apenas comenzamos esta construcción. Ya se han invertido miles de millones de dólares, pero aún falta construir infraestructura por valor de billones de dólares.

A nivel global, vemos que las fábricas de chips, ensambladoras de computadoras y fábricas de AI se están construyendo a una escala sin precedentes. Esto se convertirá en la mayor infraestructura de la historia humana.

El personal necesario para esta construcción es enorme. Las fábricas de AI requieren electricistas, plomeros, soldadores, trabajadores de acero, técnicos en redes, instaladores y operadores, entre otros. Son trabajos altamente especializados, bien remunerados y actualmente escasos. Participar en esta transformación no requiere un doctorado en ciencias de la computación.

Al mismo tiempo, AI está aumentando la productividad en toda la economía del conocimiento. Por ejemplo, en radiología, AI ya ayuda a interpretar escaneos, pero la demanda de radiólogos sigue creciendo. Esto no es contradictorio.

El radiólogo se encarga del cuidado del paciente, y la interpretación de imágenes es solo una parte de su trabajo. Cuando AI asuma más tareas rutinarias, los radiólogos podrán centrarse en el diagnóstico, la comunicación y el cuidado. La eficiencia hospitalaria aumentará, pudiendo atender a más pacientes y empleando a más personal.

El aumento de productividad genera capacidad, y mayor capacidad impulsa el crecimiento.

¿Qué cambios hubo en el último año?

En el último año, AI cruzó un umbral importante. El rendimiento de los modelos mejoró notablemente, permitiendo su uso a gran escala. La capacidad de razonamiento se fortaleció, las alucinaciones disminuyeron y la implementación práctica aumentó significativamente. Por primera vez, las aplicaciones basadas en AI comenzaron a generar valor económico real.

Las aplicaciones en descubrimiento de fármacos, logística, atención al cliente, desarrollo de software y manufactura ya muestran una fuerte alineación con el mercado. Estas aplicaciones impulsan cada capa de la arquitectura.

Los modelos de código abierto juegan un papel clave. La mayoría de los modelos en todo el mundo son gratuitos y abiertos. Investigadores, startups, empresas e incluso países dependen de estos modelos abiertos para participar en AI avanzada. Cuando los modelos abiertos alcanzan niveles de vanguardia, no solo cambian el software, sino que activan toda la cadena de tecnología.

DeepSeek-R1 es un ejemplo destacado. Al abrir ampliamente modelos de razonamiento potentes, acelera la adopción en la capa de aplicaciones y aumenta la demanda en las capas inferiores para entrenamiento, infraestructura, chips y energía.

La clave del asunto

Cuando consideras AI como una infraestructura imprescindible, su impacto se vuelve evidente.

AI comenzó con grandes modelos de lenguaje Transformer, pero su significado va mucho más allá. Es una revolución industrial que está transformando la producción y el consumo de energía, los patrones de construcción de fábricas, la organización del trabajo y las rutas de crecimiento económico.

Hoy, las fábricas de AI están en construcción, porque la inteligencia ahora se genera en tiempo real. Los chips están siendo rediseñados, ya que la eficiencia determina la velocidad de expansión de la inteligencia. La energía se vuelve un elemento central, porque fundamentalmente decide el límite superior de producción de inteligencia. Las aplicaciones avanzan rápidamente, ya que los modelos básicos han superado el umbral y se usan a gran escala.

Cada capa se refuerza mutuamente.

Por eso, la escala de construcción de AI es tan grande; puede impactar múltiples industrias y no está limitada a un solo país, región o sector. Cada empresa usará AI, y cada país desarrollará AI.

Seguimos en una etapa temprana. La mayor parte de la infraestructura aún no está construida, la mayor parte de la fuerza laboral no ha sido capacitada y la mayoría de las oportunidades aún no se han explorado.

Pero la dirección ya está clara.

AI está convirtiéndose en la infraestructura del mundo moderno. La decisión, la velocidad de construcción, la participación y la forma en que se despliega de manera responsable determinarán el rumbo de esta era.

NVIDIA GTC se celebrará del 16 al 19 de marzo de 2026 en San José, California, EE. UU., y también en línea. Te invitamos a explorar con nosotros las infinitas posibilidades de la próxima generación de AI.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado