Otra línea de tendencia a la baja en el mercado de IA: OpenAI también se ve obligado a reducir precios

Resumen rápido

· Ejecutivos de Uber dijeron directamente que la relación entre el consumo de tokens y la mejora de productos reales «aún no existe»; OpenAI también reconoce que los costos de IA empresarial se están convirtiendo en un problema cada vez más tangible.

· La demanda de IA no ha desaparecido, pero las empresas comienzan a pasar de pruebas a auditorías de ROI, los fabricantes de modelos discuten reducciones de precios, y el crecimiento en la nube, GPU y centros de datos necesita ser reevaluado.

· Activos relacionados: NVDA, MSFT, AMZN, GOOG, MU, AVGO, AMD, TSM, ARM, ORCL.

El mercado de acciones de IA, que ha subido durante dos meses consecutivos, ha comenzado a debilitarse y retroceder, y el mercado busca causas abiertamente.

Las tasas de interés, la sobrevaloración, las perturbaciones en los informes financieros pueden explicar esta corrección, pero el mercado está auditando una hipótesis más fundamental: ¿el mayor consumo de tokens por parte de las empresas necesariamente genera más ingresos, eficiencia y beneficios?

En los últimos dos años, la cadena de transacciones de IA ha sido muy fluida. Las empresas usan mucho IA, el consumo de tokens (unidad de medida para procesar texto en modelos) aumenta, los ingresos de los fabricantes de modelos crecen, los proveedores de la nube venden más potencia de cálculo, y la demanda de GPU, HBM (memoria de alto ancho de banda), servidores, centros de datos y electricidad continúa expandiéndose. Mientras el consumo de tokens siga creciendo, el mercado puede interpretarlo como una aceleración en la adopción de IA, otorgándole valoraciones más altas en hardware y gastos de capital upstream.

Pero un cambio reciente es que incluso los proveedores de modelos comienzan a discutir sobre costos.

Según The Wall Street Journal, OpenAI está investigando reducir aún más los precios de las llamadas a modelos para hacer frente a la presión presupuestaria de las empresas y a la competencia de rivales como Anthropic. Al mismo tiempo, el CEO de OpenAI, Sam Altman, ha declarado públicamente que cada vez más empresas consideran los costos de IA como un problema importante, y algunos clientes ya han agotado su presupuesto anual en el primer trimestre.

Este hecho por sí solo quizás no cambie la estructura del sector, pero envía una señal importante: el mercado ya no solo discute la capacidad de los modelos, sino también los costos, precios y retorno de inversión.

Lo que ahora se relaja no es «¿las empresas usan IA o no?», sino «¿están dispuestas a seguir pagando incondicionalmente por tokens caros?».

Andrew Macdonald, presidente y director de operaciones de Uber, dijo en un podcast que la relación entre el aumento en el consumo de tokens y las «funciones útiles para el consumidor» «aún no existe». Esta declaración proviene del lado que paga, no del vendedor, banco de inversión o startup de modelos.

Si antes el mercado creía que «el volumen es igual a éxito», ahora entra en una segunda fase: ¿los tokens finalmente pueden convertirse en crecimiento de ingresos, reducción de costos laborales o mejora en márgenes de beneficio? Una vez que el departamento financiero plantee sistemáticamente esta pregunta, la valoración de toda la cadena de valor de IA cambiará de «demanda ilimitada» a «verificación de retorno».

La alta adopción de Uber revela presión presupuestaria

El caso de Uber es digno de atención, no porque no entienda IA, ni porque no quiera usarla. Al contrario, la adopción interna de herramientas de IA en Uber es muy alta. Según varios medios, de unos 5000 ingenieros, la tasa de uso mensual llegó a entre 84% y 95%, con facturación mensual por ingeniero que varía desde unos pocos cientos de dólares hasta 2000 dólares.

El problema está aquí. Cuando la tasa de uso es tan alta, la factura deja de ser un gasto de prueba menor en innovación y pasa a ser un costo real que debe ser explicado por operaciones. Como reveló el CTO, Uber agotó su presupuesto anual para Claude Code en solo 4 meses. Macdonald describió esto como un momento «que te hace explotar la cabeza».

Dentro de la empresa, las herramientas de IA inicialmente entran en presupuesto bajo la excusa de «mejorar la eficiencia». Los ingenieros generan código más rápido, el servicio al cliente responde más rápido, los equipos de operaciones escriben informes más rápido; estos son cambios perceptibles.

Pero cuando la escala de uso crece, los departamentos financieros empiezan a plantear preguntas más duras: ¿ha generado más ingresos? ¿ha reducido costos reales de personal? ¿ha mejorado los márgenes de beneficio?

El fenómeno de «tokenmaxxing» que Macdonald menciona también indica que un alto uso puede estar desvinculado de alto valor. Tokenmaxxing se refiere a que equipos o individuos consumen tokens en exceso para maximizar el uso de IA. Los datos de uso parecen buenos, pero no necesariamente conducen a mejores resultados de producto. Para los proveedores de IA, esto significa ingresos; para las empresas, puede ser solo otra factura descontrolada en la nube.

La señal de Uber es más importante que simplemente decir que «las herramientas de IA son demasiado caras».

No se trata de decir que la IA no sirve, sino de que cuando pasa del presupuesto de prueba al presupuesto operativo, las empresas deben demostrar que cada dólar gastado en tokens puede generar resultados comerciales medibles. Alta adopción ya no significa éxito automáticamente; más bien, expone primero la estructura de costos.

La presión de costos se transmite en toda la cadena de valor

Los compradores empresariales empiezan a hacer cuentas, y las plataformas también cambian sus modelos de cobro.

GitHub anunció que a partir del 1 de junio de 2026, Copilot pasará a un modelo de pago por uso, introduciendo créditos mensuales de IA (límites de uso de IA). Para usuarios ocasionales, esto puede ser solo un cambio en la estructura de facturación; para desarrolladores que usan mucho las funciones inteligentes, algunos reportan que el costo por sesión puede llegar a decenas de dólares, y la discusión en la comunidad aumenta.

Esto significa que las plataformas ya no quieren cubrir totalmente el costo de tokens ilimitados en una suscripción fija.

Antes, los usuarios pagaban una tarifa mensual y la plataforma asumía los costos de llamadas a modelos. Ahora, con más llamadas, mayor contexto y tareas múltiples, los costos se vuelven explícitos. Cuanto más se use, más se paga; esto corrige la narrativa de «IA ilimitada».

Lo más importante es que esta presión ya se transmite desde la capa de aplicaciones a la de modelos.

En los últimos dos años, la narrativa principal en la industria de grandes modelos ha sido reducir costos, aumentar eficiencia y escalar. Pero ahora, con los departamentos de compras auditando ROI, los proveedores de modelos enfrentan una nueva pregunta: si los clientes no quieren seguir pagando precios altos por tokens, ¿cómo sostener el crecimiento?

Las señales recientes de OpenAI son típicas. Por un lado, Sam Altman admite que los presupuestos empresariales están bajo presión; por otro, circulan rumores de que OpenAI estudia reducir aún más los precios. Esto indica que el foco del sector está cambiando de «¿el modelo es líder?» a «¿el costo por unidad inteligente es lo suficientemente bajo?».

Para los clientes empresariales, la pregunta clave ya no es qué modelo es más potente, sino cuál genera más resultados comerciales con el mismo presupuesto.

Microsoft también está reduciendo licencias de Claude Code, según informes de The Verge, Axios y TechRadar. La división de Experiencias y Dispositivos de Microsoft eliminó la mayoría de las licencias internas de Claude Code y se está moviendo hacia su propia herramienta Copilot. La escala y las razones aún no se revelan completamente, pero no se puede afirmar que Microsoft haya confirmado recortes por costos.

Pero este movimiento al menos indica que las grandes tecnológicas también están redistribuyendo los costos de llamadas a modelos externos.

El impacto en la cadena de valor de IA no es tanto en que los ingresos de alguna herramienta disminuyan, sino en que la disciplina de compra empieza a transmitirse hacia arriba. Las empresas pueden limitar cuotas, elegir modelos más baratos, transferir tareas a código abierto o autoconstrucción, o exigir descuentos a los proveedores. Los fabricantes de modelos y las empresas de aplicaciones seguirán teniendo demanda, pero el poder de fijar precios ya no solo lo decide «el modelo más potente», sino también «si el cliente puede justificar los gastos».

Los proveedores de la nube también se verán afectados. Antes, los ingresos en la nube relacionados con IA tenían una narrativa fuerte: entrenamiento, inferencia y aplicaciones empresariales requieren potencia de cálculo, y cuanto más tokens, mayor demanda en la nube. Pero si las empresas empiezan a reducir costos unitarios de tokens o a mover tareas de alta frecuencia y bajo valor a caminos de inferencia más baratos, la elasticidad de ingresos en la nube puede ser menor a lo esperado.

La alta utilización requiere demostrar alto valor

Las empresas comienzan a auditar en este momento, en parte porque el uso de IA ya ha alcanzado una escala suficiente para que las partes ineficientes no puedan ser ignoradas.

Un estudio de Entelligence.AI publicado en mayo de 2026 analizó 2444 organizaciones y más de un millón de solicitudes de extracción (Pull Requests). Según sus cálculos, en cada dólar de costo de tokens de IA, solo 0.18 dólares generaron valor real para el usuario, 0.44 dólares se usaron para arreglar errores introducidos por IA, 0.27 dólares para rehacer trabajo, y 0.11 dólares en fricciones de revisión.

Este dato no puede generalizarse a toda la industria. Proviene de una investigación propia del proveedor y refleja principalmente escenarios de ingeniería de software, no auditorías independientes o estudios académicos. Pero sí muestra un problema: las empresas enfrentan presión de ROI, especialmente en escenarios donde el contenido generado por IA requiere revisión, corrección e integración humanas.

La herramienta de IA más fácil de demostrar es la velocidad de generación, pero lo que las empresas realmente pagan son los resultados entregables. Si el código generado por IA trae más errores, requiere más revisión, rehacer y pruebas, el tiempo ahorrado en la parte frontal se verá reflejado en la parte trasera. Para usuarios individuales, puede ser solo una cuestión de experiencia; para grandes empresas, se convierte en un problema financiero y de gestión organizacional.

Esto también explica por qué el crecimiento en el uso de tokens ya no puede igualarse simplemente con el éxito de IA.

El token es la unidad de facturación de ingresos y también de costos. Para los fabricantes de modelos, más tokens significan más ingresos; para las empresas, solo valen la pena si generan más ingresos, reducen costos o mejoran márgenes de beneficio.

Si antes el mercado consideraba el crecimiento de tokens como un indicador líder de demanda de hardware, ahora debe complementarse con otra métrica: la tasa de conversión del valor de tokens. Solo cuando el consumo de tokens se traduzca de manera estable en resultados comerciales, los ingresos de la nube, pedidos de GPU, expansión de HBM y construcción de centros de datos tendrán un soporte más sólido.

La voluntad de pagar se transmite en toda la cadena de valor

El estratega macro Andreas Steno Larsen señaló recientemente que el Índice de Gasto en Tokens de LLM (Silicon Data) es uno de los gráficos a seguir en el mercado actual. Los informes indican que este índice, que rastrea cuánto pagan las empresas por cada millón de tokens, subió claramente a principios de 2026 y luego mostró una caída cerca de finales de mayo.

Es importante mantener un margen. La página pública de Silicon Data es más una presentación de productos, y no se han divulgado completamente los métodos del índice ni datos históricos completos. No debe tomarse como una conclusión definitiva, pero sí como una señal para observar la voluntad de pago de las empresas.

La caída en el índice de gasto en tokens no significa necesariamente una disminución en el uso de IA.

De hecho, el mercado actual parece estar presenciando una transición de la «competencia en potencia de cálculo» a la «competencia en costo por unidad inteligente». Las empresas aún necesitan IA, pero quizás no quieran seguir comprando a los precios anteriores.

Si OpenAI finalmente inicia una nueva ronda de ajuste de precios, esto aliviará la presión presupuestaria de las empresas y también marcará la entrada oficial del sector en una fase de competencia de precios. Entonces, el mercado tendrá que reevaluar: ¿el crecimiento futuro proviene de la demanda adicional o del aumento en uso tras la caída de precios?

La demanda de IA aún puede crecer, pero la calidad de los ingresos y la elasticidad en la transmisión upstream podrían cambiar.

El impacto en diferentes niveles será distinto. La capa de aplicaciones y la de modelos enfrentan primero la presión de precios: las empresas exigirán un ROI más claro, reducirán llamadas de bajo valor o cambiarán de modelo para ahorrar costos.

Los proveedores de la nube enfrentan un problema de elasticidad de ingresos: si el uso se mantiene igual pero los precios unitarios bajan, o si aumentan las tareas en caché y procesamiento por lotes, el crecimiento de ingresos en la nube puede ser menor que el crecimiento en tokens.

En niveles superiores, la compra de GPU, HBM, empaquetado avanzado, servidores y construcción de centros de datos representa inversión de capital futura. Si la disciplina de pago de las empresas hace que los fabricantes de modelos y los proveedores de la nube sean más cautelosos, los pedidos de hardware y la expansión de centros de datos serán reevaluados.

La advertencia de Larsen no es que la demanda de hardware desaparezca inmediatamente, sino que si los precios de tokens siguen debilitándose, el mercado empezará a dudar de la pendiente del ciclo de inversión en infraestructura de IA.

La corrección en las acciones de IA y la auditoría de facturación de tokens no son una relación causal simple. No se puede decir que la caída en las acciones de chips sea por que Uber agotó su presupuesto, pero están en la misma cadena: cuando la valoración ya refleja un crecimiento alto a largo plazo, cualquier señal sobre la voluntad de pago final y ROI se amplifica en una reevaluación del gasto de capital upstream.

Lo que sigue: observar los informes financieros para ver la elasticidad de ingresos y el ritmo de pedidos

Aún no hay suficiente evidencia para decir que «la burbuja de IA ha explotado». Las empresas siguen usando IA, y los desarrolladores no volverán a un estado sin Copilot, Claude u otras herramientas inteligentes. La evaluación más razonable es que la adopción de IA está pasando de una fase de entusiasmo inicial a una fase de disciplina presupuestaria, y el mercado empieza a distinguir qué casos pueden demostrar retorno y cuáles solo generan facturación.

Lo más importante ahora no es encontrar otra empresa que diga que IA es demasiado cara, sino observar si los informes de las empresas de nube y software cambian en su lenguaje. La velocidad de crecimiento en ingresos de IA en Microsoft, Amazon y Google, si puede mantenerse con alta elasticidad; cómo cambian las renovaciones, reducciones y quejas en herramientas empresariales como Copilot y Claude Code tras el cobro por uso; todo esto será más revelador que el simple movimiento del precio de las acciones para entender si la disciplina de los compradores está fortaleciendo sistemáticamente.

En hardware, hay que vigilar si hay señales de recortes en pedidos de GPU, HBM y centros de datos. Mientras los gastos de capital en la nube sigan aumentando y los pedidos de chips avanzados sigan siendo ajustados, la caída en la voluntad de pagar tokens será más una corrección saludable. Si la elasticidad de ingresos en la nube se debilita y los pedidos de hardware y la expansión de centros de datos se desaceleran, el mercado lo valorará como un punto de inflexión más profundo en el ciclo.

La negociación de IA no ha terminado, pero su lenguaje de precios está cambiando. Antes, el mercado preguntaba «¿cuántos tokens usaste?», ahora pregunta «¿cuánto beneficio final generaron esos tokens?». Esa diferencia determinará la dirección de la futura valoración de toda la cadena de IA.

Haz clic para conocer las posiciones abiertas de律动BlockBeats:

Únete a la comunidad oficial de律动BlockBeats:

Grupo de suscripción en Telegram: https://t.me/theblockbeats

Grupo de Telegram: https://t.me/BlockBeats_App

Cuenta oficial en Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado