La GPU convirtió a Nvidia en la empresa más valiosa de la historia.


El chip que la reemplaza ya está siendo construido por Google, Amazon, Meta, Microsoft y OpenAI simultáneamente.
Aquí está lo que eso significa para hacia dónde fluye realmente el dinero a continuación.
Primero, necesitas entender por qué la GPU se convirtió en rey.
Regresa a 2012.
Una red neuronal llamada AlexNet aplastó a la competencia en un concurso global de reconocimiento de imágenes usando una sola idea.
El procesamiento paralelo que Nvidia construyó en las GPUs para renderizar gráficos realistas en videojuegos es estructuralmente idéntico a lo que requiere entrenar una red neuronal.
Miles de núcleos más pequeños realizando multiplicaciones de matrices simultáneamente en lugar de unos pocos núcleos potentes ejecutando tareas secuenciales.
Un investigador tomó una GPU y la hackeó para exponer esas capacidades de cálculo paralelo para el aprendizaje profundo.
Ese momento inició una carrera de una década que convirtió a Nvidia de una compañía de juegos en la capa de infraestructura de toda la economía de IA.
Se enviaron seis millones de GPUs Blackwell en el último año solo.
Un solo rack de servidores Blackwell de 72 GPUs se vende por aproximadamente 3 millones de dólares.
Nvidia está enviando mil de ellos cada semana.
Por un breve momento en octubre, Nvidia se convirtió en la primera compañía en la historia en alcanzar una valoración de 5 billones de dólares.
Eso es lo que una idea de 2012 se convirtió en con el tiempo.
Pero la GPU tiene un problema estructural del que nadie hablaba en voz alta hasta hace poco.
Es una navaja suiza.
Extraordinariamente capaz en una amplia gama de cargas de trabajo de IA, pero no optimizada para ninguna en particular.
En la era de auge temprano de los grandes modelos de lenguaje, esa flexibilidad era el punto.
El entrenamiento requería computación paralela de propósito general masiva y la GPU la entregaba mejor que cualquier otra cosa disponible.
Pero a medida que los modelos maduraron, el equilibrio cambió.
Las técnicas post-entrenamiento han hecho que los modelos sean cada vez más capaces.
Ahora la carga de trabajo dominante no es el entrenamiento.
Es una inferencia.
Cada vez que abres Claude, ChatGPT, Gemini, o cualquier producto de IA y recibes una respuesta, eso es inferencia.
Cada transacción en la app de Starbucks, cada flujo de trabajo en Salesforce, cada asistente de IA que funciona en tus EarPods.
Todo es inferencia.
Y la inferencia puede ejecutarse en chips menos potentes programados para tareas más específicas.
Ese cambio en el equilibrio de cargas de trabajo fue lo que abrió la puerta para el chip que ahora se está construyendo para desafiar el dominio de Nvidia.
El ASIC es el chip que cambia el mapa.
Circuito Integrado de Aplicación Específica.
Donde una GPU es una navaja suiza, un ASIC es una herramienta de propósito único.
Hardwired para realizar exactamente las operaciones matemáticas para un tipo de trabajo.
Más rápido en ese trabajo, más eficiente en energía en ese trabajo, y significativamente más barato de operar a escala para ese trabajo que cualquier GPU de propósito general.
La desventaja es la flexibilidad.
Una vez tallado en silicio, un ASIC no puede ser reprogramado para una carga de trabajo diferente.
Pero para las empresas que ejecutan inferencia a escala de miles de millones de solicitudes diarias, esa desventaja no es un inconveniente.
Es precisamente el punto.
Google fue la primera.
El TPU, Unidad de Procesamiento de Tensores, lanzado en 2015, ayudó a liderar la invención de la arquitectura transformer en 2017.
El transformer es la base de prácticamente todos los sistemas de IA modernos que funcionan hoy.
El séptimo chip de Google, Ironwood, acaba de lanzarse junto con un acuerdo para entrenar a Claude en hasta un millón de TPUs.
Amazon construyó Trainium e Inferentia tras adquirir una startup de chips israelí en 2015.
Anthropic actualmente entrena sus modelos en medio millón de chips Trainium2 dentro de un centro de datos de Amazon en Indiana, sin GPUs de Nvidia en el edificio.
Trainium ofrece entre un 30 y un 40 por ciento mejor rendimiento en precio que los proveedores de hardware competidores en AWS, según datos de Amazon.
Meta tiene su propio acelerador de entrenamiento e inferencia.
Microsoft tiene sus chips Maia dirigidos a los centros de datos de Azure.
OpenAI está construyendo ASICs personalizados en asociación con Broadcom a partir de 2026.
Cada gran hyperscaler está construyendo su propio chip simultáneamente.
No como un experimento.
Como una decisión estratégica de infraestructura que vale cientos de miles de millones de dólares en compromiso de capital.
Broadcom es el nombre que la mayoría de las personas fuera de la industria de chips aún no ha valorado en su tesis.
Cada gran hyperscaler con un programa de ASICs se asocia con al menos una compañía de diseño de chips para la propiedad intelectual, la experiencia en ingeniería y la infraestructura de red que conecta los chips a escala.
Broadcom domina ese mercado.
TPUs de Google. Aceleradores de entrenamiento de Meta. Ahora ASICs personalizados de OpenAI.
Los analistas que rastrean este espacio estiman que Broadcom está ganando entre el 70 y el 80 por ciento del mercado de ASICs personalizados en backend.
Se proyecta que ese mercado crezca a una tasa de crecimiento anual compuesta de doble dígito medio en los próximos cinco años.
La ola de ASICs acelera más rápido que el mercado de GPUs.
Broadcom se encuentra en el centro de casi todo ello.
Luego está la capa de borde que la mayoría aún no sigue.
A medida que madura la IA en centros de datos, el próximo campo de batalla es la inferencia en el dispositivo.
Tu teléfono. Tu coche. Tu portátil. Tus wearables.
La Unidad de Procesamiento Neural es el chip que impulsa la IA localmente sin enviar datos a un servidor en la nube.
La privacidad, la velocidad y la eficiencia en costos mejoran cuando la inferencia se ejecuta en el dispositivo en lugar de en un centro de datos.
Qualcomm domina las NPUs para Android.
Los chips M-series de Apple incluyen un motor neural dedicado para MacBooks.
Los chips de la serie A en los últimos iPhones tienen aceleradores neuronales integrados.
AMD e Intel compiten por NPUs en laptops con Windows.
Los dólares están concentrados hoy en los centros de datos.
Pero el volumen de chips necesarios para poner IA en cada teléfono, coche, robot y wearable en la Tierra es una magnitud mayor que el mercado de centros de datos.
Esa transición ya ha comenzado.
La capa geopolítica debajo de todo esto es la restricción de la que nadie en la narrativa de consumo habla lo suficiente.
Casi todos los chips en todo este ecosistema, Nvidia Blackwell, TPU de Google, Trainium de Amazon, chips A de Apple, son fabricados por una sola compañía.
Taiwan Semiconductor Manufacturing Company.
TSMC.
La concentración de fabricación avanzada de semiconductores en Taiwán es el mayor cuello de botella geopolítico en la carrera global de IA.
La Ley CHIPS inició el proceso de construcción de fábricas de TSMC en Arizona.
El Blackwell de Nvidia ya está en plena producción en la instalación de Arizona.
Intel está fabricando chips de nodo avanzado en una nueva fábrica en Arizona.
Pero el chip más reciente de Apple para iPhone aún requiere el proceso de tres nanómetros de TSMC, que actualmente solo está disponible en Taiwán.
La relocalización de la fabricación de semiconductores a Estados Unidos está en marcha, pero el calendario se mide en años, no en meses.
Y China está construyendo su propia pila paralela.
Huawei, ByteDance y Alibaba están desarrollando ASICs personalizados bajo controles de exportación que limitan su acceso a los equipos más avanzados y a los chips Blackwell de Nvidia.
La carrera por los chips de IA no es solo una competencia tecnológica.
Es una guerra de infraestructura geopolítica que se pelea en silicio.
El país que asegure la capacidad de fabricación más avanzada y la fuente de energía más confiable para operarla gana algo mucho más valioso que un mercado.
Aquí está el marco que une todo esto.
Nvidia ganó su posición.
Años de inversión en ecosistemas de desarrolladores, CUDA como una barrera de software propietaria, y una hoja de ruta de hardware que se mantuvo por delante de todos los competidores construyeron una de las ventajas competitivas más duraderas en la historia de la tecnología.
Esa ventaja no desaparece de la noche a la mañana.
Pero el mercado se está volviendo tan grande que crea espacio para que emerjan una capa completamente nueva de ganadores junto a Nvidia en lugar de simplemente reemplazarla.
Los hyperscalers reduciendo su dependencia de Nvidia mediante ASICs personalizados.
Broadcom capturando toda la infraestructura de backend de cada programa principal de ASICs simultáneamente.
Qualcomm y Apple dominando la capa de inferencia en el borde a medida que la IA se desplaza a cada dispositivo.
TSMC permaneciendo como el cuello de botella de fabricación irremplazable sin importar qué arquitectura de chip gane.
Y debajo de todo, la infraestructura de energía necesaria para operar todo a escala, convirtiéndose en la restricción que determina quién puede construir realmente a la velocidad que exige la carrera de IA.
La GPU convirtió a Nvidia en la empresa más valiosa de la historia.
Las empresas que entendieron ese momento de 2012 antes de que se volviera obvio nunca necesitaron explicar su cronología.
La misma brecha de percepción existe ahora mismo en la transición a ASIC.
Las personas que prestan atención a la capa de chips debajo de la carrera de modelos ya están posicionadas.
Las personas que actúen esta noche entenderán por qué mañana.
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado