Meta vende capacidad de cómputo, Palantir insulta en la calle, Zhipu se convierte en la máxima tendencia de Silicon Valley, la historia de AI Capex necesita una nueva narrativa.

Escrito por: 涨声 Beatz

El mercado de IA vuelve a sufrir una corrección violenta, esta vez porque Meta dijo que podría vender el excedente de su capacidad de cómputo de IA.

Si esta noticia hubiera salido hace tres años, probablemente nadie la habría encontrado extraña. La computación en la nube siempre ha sido un negocio de cortar servidores en pedazos y venderlos a otros. Amazon, Microsoft y Google lo han hecho durante años. Nuevos proveedores de nube como CoreWeave y Nebius también han seguido este camino, convirtiendo los chips de NVIDIA en garantía de financiamiento, y luego el financiamiento en más chips.

Pero cuando le tocó a Meta, las cosas cambiaron de sabor.

Meta no solía entender la capacidad de cómputo de esta manera. Compraba chips, construía centros de datos, aseguraba energía y terrenos para sus propios modelos, para su sistema de anuncios, para su feed de recomendaciones, para la superinteligencia cada vez más cercana que Zuckerberg menciona. No es un proveedor de nube. Originalmente no ganaba dinero alquilando sus máquinas a otros.

Una empresa que antes decía: "Necesito tantas máquinas como sea posible, porque el futuro las consumirá". Ahora dice: "Si estas máquinas no se usan temporalmente, también se pueden vender a otros".

Esto no prueba directamente un exceso de capacidad de cómputo, pero tampoco se puede pasar por alto.

El día del desplome del mercado de valores, Alex Karp, CEO de Palantir, en una entrevista en CNBC, insultó frente a la cámara durante casi veinte minutos.

Originalmente fue a hablar sobre la nueva colaboración entre Palantir y NVIDIA, pero rápidamente desvió el tema hacia el modelo de cobro por token de OpenAI y Anthropic. Dijo que los CEOs se quejaban en privado de que la adopción empresarial de IA actual es "pagar por tokens que no generan ningún valor, y además tener que entregar sus datos". Incluso calificó las facturas cada vez más caras de los modelos como un impuesto a la riqueza que pesa sobre las empresas.

En los últimos dos años, se discutía quién se atrevía a gastar, quién gastaba más rápido, quién podía apilar centros de datos primero. Ahora la pregunta cambia lentamente. Una vez compradas las máquinas, ¿quién puede mantenerlas funcionando al máximo?

La declaración de Meta aún no se ha materializado como un negocio formal. En informes públicos, tiene una dirección interna llamada Meta Compute, que podría vender capacidad de cómputo bruta o, como Amazon Bedrock, poner diferentes modelos en su infraestructura y venderlos a desarrolladores. Zuckerberg mencionó anteriormente en una reunión de accionistas que casi todas las semanas empresas externas preguntan si pueden comprar su servicio API o una parte de su cómputo, y están dispuestas a pagar un precio superior al costo de Meta.

También añadió una frase entonces. Aún no lo han hecho, porque Meta cree que todavía necesita esa capacidad de cómputo.

Si se necesita, alquilar es una opción. Si no se necesita, alquilar es un analgésico para el balance.

Aquí está lo más difícil de juzgar. Meta podría estar simplemente abriendo una ventana dentro de su ritmo de construcción para vender recursos temporalmente vacíos. También podría estar diciendo a los inversores que el gasto en IA de cientos de miles de millones de dólares no puede sostenerse solo con una superinteligencia lejana, y que primero debe encontrar una línea de ingresos más cercana.

Ambas afirmaciones pueden ser válidas.

La demanda no ha desaparecido, solo está empezando a seleccionar

El Capex es el núcleo de la narrativa de la IA, sin excepción. Al igual que la inyección de liquidez de 2021, el Capex se espera que siga creciendo, el dinero sigue fluyendo, y todas las ramas en las que el mercado especula suben juntas. En cuanto se vio que Meta planeaba vender capacidad de cómputo, muchos reaccionaron pensando que el Capex de IA se derrumbaría. Las grandes empresas finalmente admitieron que compraron demasiado, y la fiesta de los semiconductores debería terminar.

Decir eso es demasiado simplista.

Los datos públicos aún no respaldan una conclusión tan rotunda. Los ingresos de AWS en el primer trimestre aumentaron un 28%, alcanzando los 37.6 mil millones de dólares, un crecimiento rápido poco común en los últimos años. Google Cloud creció aún más en el primer trimestre, con ingresos de 20 mil millones de dólares. Microsoft Azure también sigue corriendo a una velocidad de alrededor del 40%.

Amazon sigue diciendo que el gasto de capital de este año podría alcanzar los 200 mil millones de dólares. Alphabet elevó la guía de gasto de capital para 2026 a entre 180 y 190 mil millones de dólares. Meta misma elevó su gasto de capital anual a entre 125 y 145 mil millones de dólares.

Estas cifras no parecen un colapso de la demanda.

Parecen más una bifurcación.

La situación de los proveedores de nube es diferente a la de los proveedores de modelos. Los proveedores de nube venden caminos. Mientras haya gente circulando en el camino, sin importar quién haya construido el vehículo, pueden cobrar. OpenAI, Anthropic, clientes empresariales, clientes gubernamentales, startups, todos terminan en algún centro de datos, algún chip, alguna red y algún contrato de energía.

Por eso los tres grandes de la nube pueden seguir siendo fuertes.

AWS incluso aumentó el precio de un servicio de nube de IA a finales de junio. Es un servicio que permite a los clientes reservar GPU con antelación. AWS volvió a subir el precio de este servicio aproximadamente un 20% a partir de julio. Ya lo había ajustado en enero, alrededor de un 15%. Esto no es una acción que ocurra cuando la demanda es débil.

Cuando hay escasez, el vendedor sube el precio.

Pero las empresas de modelos no necesariamente pueden estar tan cómodas.

Los activos de las empresas de modelos son más exigentes. La capacidad de cómputo no genera ingresos por sí sola solo por estar allí. Debe ser llenada constantemente por modelos más inteligentes, usuarios más frecuentes y flujos de trabajo empresariales más caros. Solo cuando el modelo es lo suficientemente bueno, los usuarios están dispuestos a soportar colas, límites, aumentos de precio y niveles de suscripción cada vez más complejos.

Por eso Anthropic es vista por el mercado como otro tipo de empresa. No porque sea barata, sino porque los usuarios están dispuestos a encomendarle tareas costosas. Escribir código, modificar sistemas, ejecutar tareas largas, integrar flujos de trabajo empresariales: una vez que estas tareas realmente entran en un entorno de producción, consumen muchos más tokens que una charla casual.

El problema de un modelo fuerte es que no tiene suficientes máquinas.

El problema de un modelo débil es que a nadie le importan sus máquinas.

Estos dos problemas se llaman capacidad de cómputo, pero no son lo mismo.

La línea de xAI también tiene el mismo sabor. Grok no ha formado una mentalidad empresarial clara como los modelos más fuertes, pero parte de la capacidad de cómputo en el ecosistema de Musk puede fluir hacia Anthropic. Esta acción es más fría que cualquier eslogan. Las máquinas no reconocen al fundador; solo reconocen quién puede mantenerlas funcionando al máximo.

La relación entre Google y Meta también muestra que las cosas no son tan simples. En junio, se supo que Google limitó el uso de Gemini por parte de Meta, porque la capacidad de cómputo que Meta quería comprar superaba lo que Google podía ofrecer, e incluso afectó algunos proyectos internos de IA de Meta. Una empresa que por un lado considera vender capacidad de cómputo, y por otro lado no puede comprar suficiente capacidad de modelo líder para ciertas tareas.

Esto no es un exceso en el sentido tradicional.

Es un desajuste. Porque las facturas comienzan a ser llamativas.

Los proveedores de nube pueden seguir subiendo precios porque venden certeza. Los clientes quieren una GPU que puedan obtener con seguridad durante un período de tiempo, un centro de datos estable y una infraestructura que no se caiga a medianoche.

Pero una vez que los clientes empresariales obtienen la capacidad de cómputo, el problema no termina.

Tienen que entregar esa factura al CFO. El CFO no te preguntará cuántos tokens usaste; te preguntará cuánto dinero le ahorró a la empresa, cuánto dinero extra ganó y cuántos errores evitó.

Cuando llega a la empresa, el token se convierte en un medidor de electricidad

Esto nos lleva de vuelta a la entrevista de Karp al principio.

Calificó lo que muchas empresas de IA venden a las empresas como una sobreventa. El día anterior a la entrevista, Palantir publicó una declaración de nueve puntos en X sobre la llamada soberanía de la IA, en la que señaló específicamente el modelo tokenmaxxing. Esta palabra es difícil de traducir; una traducción literal suena mal, pero el significado no es complejo: tratar el consumo de tokens como progreso, la quema de dinero como uso y la factura como productividad.

Karp puso a los laboratorios de vanguardia como OpenAI y Anthropic sobre la mesa. No quiere decir que las empresas no deban usar los modelos más fuertes, sino que no deberían entregar sus datos, procesos y juicios comerciales, y luego pagar una factura cada vez más grande según el consumo.

Palantir quiere vender otra cosa. No es un cuadro de chat universal, ni una única API, sino poner datos, aprobaciones, permisos, reglas operativas e IA dentro del mismo sistema empresarial. Lo que el cliente paga no es "cuántas veces usó IA", sino si una línea de producción, un proceso de control de riesgos o una tarea gubernamental han sido realmente transformados.

Los que realmente manejan el dinero en las empresas ya están despertando.

UBS recientemente habló con ejecutivos de TI empresariales y una dirección está clara. Muchas empresas no están dejando de usar IA, sino que están poniendo frenos al gasto en IA. Alrededor del 60% de las empresas encuestadas están presionando para reducir el gasto en tokens y agregar barreras de uso, especialmente aquellas que ya han pasado la fase de prueba y están integrando IA en sus procesos diarios.

Esto también es una reversión muy interesante.

Después de que la IA pasa de ser un juguete a una herramienta, gastar dinero se vuelve más difícil. En la fase de juguete, los jefes están dispuestos a asignar presupuesto porque todos temen perderse algo. En la fase de herramienta, el CFO pregunta a quién le ahorró horas de trabajo, a quién le vendió más productos y a quién le redujo riesgos.

En esta tabla, los tokens no se parecen a los ingresos.

Se parecen más a un medidor de electricidad.

Por supuesto, se puede decir que un medidor que gira rápido significa que la fábrica está produciendo. También se puede decir que si el medidor gira demasiado rápido y la producción no aumenta, entonces la máquina tiene un problema.

Los agentes de IA amplifican este problema. Un estudio de Codex de OpenAI y varias universidades tiene un conjunto de datos alarmante. En la primera mitad de 2026, los usuarios activos de Codex crecieron más de cinco veces; los tokens de salida de algunos puestos dentro de OpenAI también se dispararon. La mediana de tokens de salida mensuales en puestos legales fue 13 veces mayor que en noviembre de 2025, y en puestos de investigación, más de 50 veces.

Otro estudio lo expresa de manera más contundente. Las tareas de codificación agentic pueden consumir hasta 1000 veces más tokens que la charla de código normal y el razonamiento de código. Para la misma tarea, el consumo de tokens entre diferentes ejecuciones puede variar hasta 30 veces.

Esta es la base de la escasez de capacidad de cómputo hoy.

No es que la gente haya preguntado un par de veces más al chatbot.

Es que el software comienza a convertirse en un grupo de pequeños trabajadores que leen archivos repetidamente, ejecutan comandos, modifican código, fallan, reinician, vuelven a fallar y vuelven a reiniciar. No tienen hora de almuerzo, pero en cada paso consumen tokens.

Cuando los tokens se convierten en medidores de electricidad, quien posee la planta de energía tiene poder. Pero quien desperdicia la electricidad también será interrogado primero.

Cuando la factura se vuelve más gruesa, los modelos baratos encuentran su lugar

Una vez que el CFO comienza a mirar este medidor, el siguiente paso es casi automático.

Preguntará: ¿qué tareas deben usar el modelo más fuerte y qué tareas solo necesitan un modelo suficiente?

En ese momento, los modelos de código abierto como GLM, Kimi, DeepSeek, Qwen ya no son solo noticias tecnológicas. Se convierten en herramientas de negociación en la mesa de compras empresariales.

Incluso Marc Andreessen, de la firma de capital riesgo de primer nivel a16z, dijo que muchos profesionales de la IA ya consideran el GLM-5.2 de Zhipu como uno de los primeros modelos chinos que pueden igualar o incluso superar a los principales modelos públicos estadounidenses en la mayoría de las tareas. Este juicio puede no ser un veredicto final, pero le da a las empresas una frase más.

Coinbase dio un ejemplo más concreto. Brian Armstrong dijo que la empresa cambió su modelo de IA predeterminado a modelos de código abierto como GLM 5.2 y Kimi 2.7, combinados con enrutamiento de modelos, almacenamiento en caché y contextos simplificados. El uso de tokens seguía creciendo exponencialmente, pero el gasto en IA se redujo casi a la mitad.

El poder de esta frase radica en que las empresas pueden, por primera vez, comprar la capacidad del modelo por separado.

Las tareas más difíciles siguen confiándose a los modelos más caros. Los resúmenes comunes, el servicio al cliente, la extracción de información, el código de plantillas y las consultas a la base de conocimiento interna se dejan a modelos baratos y despliegues locales.

Los modelos de código abierto no necesitan ganar todos los combates.

Solo necesitan que el departamento de compras crea que no cada kilovatio-hora debe pagarse al precio de la electricidad de una mansión.

Llegados a este punto, la venta de capacidad de cómputo de Meta ya no es una noticia aislada.

Habla del mismo tema que Palantir maldiciendo los tokens y Coinbase utilizando modelos de código abierto: la cadena de gastos de la IA comienza a desglosarse. El extremo superior vende certeza, el medio vende resultados y el inferior presiona el precio unitario. Cada capa sigue creciendo, pero cada capa comienza a ser cuestionada sobre si el dinero se gasta bien o no.

Lo más difícil no es comprar máquinas, sino mantenerlas trabajando constantemente

En los últimos dos años, la historia más fácil de contar en la industria de la IA fue que los recursos eran insuficientes.

Faltaban GPU, faltaba electricidad, faltaban centros de datos, faltaban ingenieros, faltaba nube para ejecutar los modelos. Esta historia era demasiado fluida. Mientras algo falte, todos se lanzan instintivamente hacia adelante. Primero asegurar la posición, primero firmar el contrato de electricidad, primero comprar los chips, primero montar las máquinas.

Cuando se están apoderando de recursos, la gente no suele hacer cálculos detallados.

Porque el costo de ser lento parece mayor.

Pero la noticia de Meta saca a la luz otro problema. Una vez compradas las máquinas, no se convierten automáticamente en un buen negocio solo porque sean caras. Necesitan tener trabajo todos los días, clientes dispuestos a pagar, modelos que las mantengan ocupadas y aplicaciones que conviertan el costo en ingresos.

Esto es la tasa de utilización.

La palabra tasa de utilización suena fría, pero en realidad es muy cruel. No pregunta si tienes futuro, sino si hoy tu máquina está funcionando. No le importa lo que dices en las conferencias de prensa, ni si compraste la GPU más cara. Solo mira una cosa: si ese dinero se ha convertido en un flujo de caja continuo.

A los proveedores de nube les resulta relativamente fácil responder a esta pregunta. Ellos ya venden infraestructura. AWS, Google Cloud y Azure venden caminos, electricidad y salas de servidores. Los clientes necesitan entrenar modelos, ejecutar inferencias y alojar aplicaciones, y todo termina en alguna nube.

Por eso todavía pueden ser fuertes.

Las empresas de modelos fuertes también tienen su propia respuesta. Si el modelo es lo suficientemente fuerte, los usuarios están dispuestos a hacer cola, las empresas a integrarse y los desarrolladores a modificar sus flujos de trabajo a su alrededor. Entonces la capacidad de cómputo no es inventario, es un cuello de botella. Cuantas más máquinas, más pueden funcionar.

Lo más difícil es la capa intermedia.

Tienen máquinas, tienen historias, tienen equipos de modelos y grandes presupuestos. Pero el modelo no ha llegado a la vanguardia, el producto no se ha convertido en un hábito diario y los desarrolladores no están dispuestos a modificar sus flujos de trabajo por él. Para este tipo de empresas, la capacidad de cómputo pasa de ser un arma a inventario con solo un lanzamiento fallido del modelo o una migración de usuarios.

El inventario no es necesariamente inútil.

Pero el inventario debe ser rebajado de precio, alquilado o encontrar nuevos usos.

Ahí está lo llamativo de Meta vendiendo capacidad de cómputo. No demuestra el fracaso de Meta, ni que la demanda de IA haya desaparecido. Solo hace que el mercado vea por primera vez que la infraestructura de IA también puede enfrentar los mismos problemas que una fábrica común.

La fábrica está construida, ¿dónde están los pedidos?

La capacidad de cómputo no ha desaparecido, solo comienza a estratificarse

Por lo tanto, la mejor manera de entender esto no es "exceso de capacidad de cómputo".

Esa palabra es demasiado burda.

Una forma más precisa es que la capacidad de cómputo comienza a estratificarse.

La capa superior sigue siendo escasa. Los mejores modelos, la mejor nube y los clústeres de GPU más estables todavía son disputados. AWS puede subir el precio de su servicio porque la certeza en sí misma tiene un precio. El cliente no solo compra GPU, sino que compra la garantía de que un día, una hora y un lote de máquinas estarán disponibles.

La capa intermedia comienza a ser incómoda. Puede que no sea mala, pero no es lo suficientemente escasa. Puede ejecutar modelos, hacer inferencias y venderse a clientes externos. Pero los clientes comparan, negocian el precio y preguntan por qué no usar un modelo más barato, por qué no usar la nube de otro y por qué este lote de máquinas vale exactamente ese precio.

La capa inferior será presionada gradualmente por los modelos de código abierto y la optimización de costos. Las empresas no llamarán al modelo más caro para siempre para tareas comunes. Harán enrutamiento, almacenamiento en caché, reducirán el contexto y dividirán los modelos en diferentes niveles.

La demanda ha crecido.

Un niño pequeño gasta dinero sin mirar la factura; un adulto lo mira. Cuando la IA entra en la empresa, también pasa por este proceso. En la fase piloto, todos temen perderse algo; en la fase de escalado, todos empiezan a hacer cuentas.

Una vez que se hacen cuentas, la cadena industrial ya no será tan uniforme como al principio.

Algunos seguirán subiendo precios porque venden una certeza insustituible. Otros cambiarán a vender resultados porque los clientes no quieren pagar por el consumo en sí mismo. Algunos se verán obligados a bajar precios porque han aparecido alternativas suficientes. Otros alquilarán sus máquinas porque tenerlas inactivas es peor que alquilarlas a bajo precio.

Estas cosas ocurriendo al mismo tiempo harán que la industria parezca contradictoria.

Por un lado, escasez de capacidad de cómputo.

Por otro lado, alquiler de capacidad de cómputo.

Por un lado, el consumo de tokens se dispara.

Por otro lado, las empresas reducen el gasto en IA.

Por un lado, los modelos líderes son cada vez más fuertes.

Por otro lado, los modelos de código abierto son cada vez más baratos.

No son contradictorios. Solo indican que la IA ha pasado de ser una historia de cantidad total a una historia de estructura.

La historia del viejo ferrocarril se contará de nuevo

En la burbuja ferroviaria del siglo XIX, los ferrocarriles no eran falsos.

Las vías se colocaban, las mercancías realmente se movían, las ciudades realmente crecían y el tiempo realmente se acortaba. Muchas de las redes comerciales más valiosas posteriores surgieron junto a esas vías.

Pero eso no impidió que muchos constructores de ferrocarriles perdieran dinero en aquel entonces.

No perdieron en la dirección. Perdieron porque construyeron demasiado pronto, demasiado, en lugares sin flujo de pasajeros o mercancías, o porque pidieron prestado dinero demasiado caro para construir una ruta que tardaba demasiado en ser rentable.

La fibra óptica en la burbuja de Internet fue lo mismo. La fibra óptica no era un error. Más tarde, todo el mundo fue sostenido por ella. El error fue ese lote de libros contables, que metieron la demanda de décadas futuras en unos pocos años de gasto de capital.

Los centros de datos de IA también pueden dejar muchas cosas útiles. Las GPU se depreciarán, los contratos de electricidad se renovarán, los centros de datos cambiarán equipos y el software cada vez consumirá más capacidad de cómputo. El consumo de tokens que hoy parece exagerado, dentro de unos años puede ser tan normal como el tráfico de video en alta definición.

Pero los activos tienen su propio carácter.

No les importa si crees en el futuro. Solo les importa si alguien viene a usarlos cada día.

La señal de Meta vendiendo capacidad de cómputo está en este punto.

No es el final de la IA. Tampoco es el final de los semiconductores. Es más como cuando la narrativa del gasto de capital llega a su punto medio, y alguien abre la puerta por primera vez para que los de fuera vean cuántas máquinas hay en el almacén.

Algunas máquinas serán consumidas por los modelos líderes.

Algunas serán alquiladas por clientes de la nube.

Algunas se abaratarán en la guerra de precios.

Y algunas esperarán tranquilamente una aplicación que aún no ha aparecido.

En los últimos dos años, el mercado estaba dispuesto a creer que todas las máquinas eventualmente encontrarían su destino. Ahora comienza a preguntar quién lo encontrará primero, quién no lo encontrará y quién, incluso si lo encuentra, no ganará suficiente dinero.

Una vez que surge esta pregunta, la historia de la IA cambia.

Ya no pertenece solo a aquellos que compran máquinas más rápido.

Pertenece a aquellos que pueden mantener las máquinas funcionando constantemente.

Enlace original

Haga clic para conocer los puestos de trabajo en 律动BlockBeats

Bienvenido a unirte a la comunidad oficial de 律动BlockBeats:

Grupo de suscripción de Telegram: https://t.me/theblockbeats

Grupo de chat de Telegram: https://t.me/BlockBeats_App

Cuenta oficial de Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado