En la primera mitad de este año, "Tokenmaxxing" se convirtió en una palabra de moda en el círculo empresarial de IA. Empresas como Meta y Salesforce promovieron activamente que los empleados consumieran la mayor cantidad posible de tokens de IA para aumentar la productividad. Internamente en Meta, incluso apareció una clasificación llamada "Claudeconomics", que rastrea a los 250 principales usuarios intensivos. Los datos muestran que los empleados de Meta consumieron más de 60 billones de tokens en 30 días, y el usuario individual más alto consumió aproximadamente 280 mil millones de tokens. Para competir por títulos como "Leyenda del Token" y "Mago del Caché", los empleados hacían que los agentes de IA pasaran horas realizando investigaciones sin sentido solo para "quemar tokens".

Posteriormente, Uber saltó a los titulares por agotar el presupuesto anual de Claude Code y Codex en cuatro meses, e inmediatamente implementó un límite de uso mensual de 1500 dólares por empleado, requiriendo aprobación caso por caso para cualquier exceso.

Estos eventos han generado una amplia atención. Sin embargo, tras realizar una investigación de campo en la Cumbre de IA de Databricks y mantener conversaciones profundas con más de 50 clientes empresariales a través de Slack y llamadas telefónicas, el equipo de SemiAnalysis llegó a una conclusión muy diferente a la narrativa mediática.

La firma sostiene que los informes de los medios han exagerado seriamente la generalidad del problema. Los casos extremos de Meta y Uber tienen su origen en una mala estructura de incentivos y una gestión interna laxa, no en una pérdida de control generalizada de la inversión empresarial en IA.

Historias de portada exageradas, datos reales más moderados

Los informes de los medios pueden haber exagerado la crisis del presupuesto de IA empresarial.

Datos clave respaldan esta evaluación. SemiAnalysis cita datos de gasto de Ramp que muestran que el 1% principal de los clientes gasta un promedio de aproximadamente 90,000 dólares por empleado al año en IA, el 10% principal alrededor de 7,300 dólares, mientras que la mediana de los clientes de Ramp es de solo 136 dólares. Los clientes de Ramp ya tienen un nivel de adopción tecnológica muy superior al de las empresas promedio, pero el gasto per cápita en IA de los clientes del sector mediático del Fortune 500 sigue siendo muy inferior a 100 dólares.

Incluso Meta, el "gran consumidor de tokens", gasta cerca de 50,000 dólares por empleado al año a precio de catálogo, y según estimaciones de SemiAnalysis, esto representa solo entre el 3% y el 5% de los ingresos de clientes de Anthropic.

La propia documentación de Anthropic lo confirma: los desarrolladores de Claude Code gastan un promedio mensual de solo 150 a 250 dólares, y solo el 10% de los usuarios gasta más de 30 dólares al día.

SemiAnalysis opina: "Los informes exagerados de los medios no son ciertos: las empresas siguen invirtiendo de forma continua, y el consumo de tokens impulsado por nuevos escenarios de demanda y sectores verticales está haciendo que el tren de la IA avance a un ritmo aún más acelerado."

Esto significa que la adopción de IA empresarial aún se encuentra en una fase de difusión desigual. No todos los empleados están utilizando modelos grandes con alta frecuencia. Muchas empresas solo tienen unos pocos equipos o puestos que comienzan primero.

El control presupuestario se convierte en la nueva norma, pero los estándares son muy diversos

De las más de 50 empresas encuestadas, la mayoría ya ha establecido límites estrictos al uso de IA. Sin embargo, los estándares varían enormemente entre empresas y no existe un consenso en la industria.

Casos de límites bajos:

Uno de los tres principales fabricantes aeroespaciales y de defensa de EE. UU.: límite de 250 dólares por persona al mes, y algunos usuarios intensivos agotaron el cupo en los primeros cuatro días del mes.
Una de las compañías farmacéuticas más grandes del mundo: límite de 500 dólares por persona al mes, y se pueden solicitar 1,000 dólares en casos especiales.

Casos de límites altos:

Workday, Stripe: presupuesto mensual por empleado de aproximadamente 2,000 dólares.
Empresa de ciberseguridad que cotiza en bolsa: empleados junior, 800 dólares al mes; empleados senior, 1,600 a 4,000 dólares; los científicos de datos obtienen el límite más alto.
Gran empresa de tecnología turística (800 ingenieros entre 1,500 empleados, gasto anual en IA cercano a 10 millones de dólares): por defecto, 200 dólares por persona al mes, que pueden aumentar a decenas de miles según el puesto.

La lógica para fijar el presupuesto también varía. Una de las tres principales aerolíneas de EE. UU. tiene el enfoque más singular: la asignación de tokens está directamente vinculada a proyectos específicos y a los ingresos esperados. Por ejemplo, para un proyecto con ingresos esperados de 10 millones de dólares, el equipo financiero aprueba un presupuesto total de gastos de 1 millón de dólares, y el equipo decide qué proporción destinar a tokens. El coste de la IA se integra en el modelo financiero del proyecto, no en un presupuesto de TI separado.

Las reglas de supervivencia de los empleados para "ahorrar tokens"

La presión presupuestaria ha generado un conjunto práctico de estrategias para ahorrar tokens.

El más típico es el "arbitraje de Copilot": los suscriptores empresariales de Microsoft 365 pueden usar ilimitadamente y de forma gratuita el chatbot Copilot estándar, y este uso no cuenta dentro del presupuesto mensual de IA. Una gran empresa holandesa de bienes de consumo y tecnología sanitaria indicó claramente que los empleados primero usan Copilot para esbozar e integrar ideas, y luego recurren a Claude o Codex para las tareas finales, ahorrando así tokens medidos.

La degradación del modelo también es una práctica común. Esa empresa global de tecnología turística ha cambiado el modelo predeterminado de Claude para todos los empleados de Opus a Sonnet; Opus sigue disponible, pero debe seleccionarse activamente. El fabricante aeroespacial y de defensa ha "desactivado" directamente Opus 4.8 y el modo rápido.

Al respecto, el equipo de SemiAnalysis comentó directamente sobre la lógica de la dirección: "La dirección cree que dar a los empleados un presupuesto mayor de tokens los llevaría a automatizar tareas que ni siquiera deberían automatizarse, como redactar correos electrónicos. Consideramos que esta visión anti-automatización es demasiado ingenua."

La demanda de tokens baratos sigue creciendo, el mercado de TaaS/API endpoints no se ha enfriado

La gestión del presupuesto no equivale a reducir el uso. A las empresas les preocupa más el coste unitario.

La demanda de tokens baratos sigue siendo fuerte. Tanto los modelos de vanguardia como los de código abierto, en forma de Token-as-a-Service/API endpoints, están creciendo. Al incluir AWS Bedrock en los cálculos, la estimación de SemiAnalysis para la tasa de crecimiento general de AWS en este trimestre es superior a las expectativas del mercado.

Los proveedores de TaaS también se están expandiendo. El ARR combinado de empresas como Together, Fireworks y Baseten ya supera los 4 mil millones de dólares.

Esto demuestra que la presión presupuestaria empresarial cambiará la estructura de adquisiciones. Los problemas que pueden resolverse con modelos baratos no requerirán llamar constantemente al modelo más caro. La degradación del modelo predeterminado no significa una reducción en el uso de IA, sino una reoptimización de la curva de costes.

La codificación sigue siendo la necesidad más fuerte, el tren de la IA no se ha ralentizado por los límites presupuestarios

La codificación sigue siendo el mayor impulsor de ingresos actual de la IA, con más del 70% del ARR de OpenAI y Anthropic proveniente de esta dirección. La proporción B2B de Anthropic supera el 90% (alrededor del 60% en OpenAI), lo que hace que su estructura de ingresos dependa más del sector empresarial y sea más estable.

Se cree que la próxima ola de crecimiento provendrá de la ciberseguridad y el trabajo de oficina de cuello blanco. A medida que productos como Cowork, CoPilot, Codex y Computer se integren más en las empresas, la trayectoria de crecimiento del ARR de los laboratorios de IA impulsada por el mercado de codificación se repetirá en escenarios más amplios.

Actualmente, la mayoría de las empresas del Fortune 500 gastan menos de 2,000 dólares por empleado al año en IA, concentrado principalmente en los departamentos de ingeniería y ciencia de datos. Esto significa que la penetración de la IA en las empresas aún se encuentra en una etapa temprana; el espacio de crecimiento no ha desaparecido, solo ha cambiado de forma: de "quemar dinero sin control" a "inversión continua con presupuesto".

El verdadero ROI de la IA: aumento de eficiencia, pero también aumentan las expectativas de producción

Entre las empresas encuestadas, existen casos reales de mejora de la eficiencia gracias a la IA, y los resultados son significativos.

Departamento de contratación de Amazon: el proceso desde la selección inicial hasta la colocación en equipo, que antes requería de 6 a 9 meses, ahora se ha reducido a 3 o 4 meses con la ayuda de herramientas de IA.
Una empresa que ofrece servicios de análisis de datos al 85% del Fortune 500: el trabajo que antes requería una semana ahora se completa en pocas horas.

Pero la otra cara de la mejora de la eficiencia es que las expectativas de producción también aumentan simultáneamente. Una empleada de una empresa de soluciones de datos legales y riesgos admitió que el trabajo de una semana se ha comprimido a unas horas, "pero la empresa ahora espera que haga más trabajo, y está más ocupada que antes".

SemiAnalysis señala que los eventos de gasto excesivo de tokens en empresas como Uber y Meta tienen su causa raíz en incentivos mal diseñados y supervisión laxa, no en la falta de escenarios de aplicación con alto ROI. A pesar de los despidos masivos en Amazon, la empresa está contratando a un ritmo más rápido gracias a las mejoras de eficiencia derivadas de las herramientas de IA; este es el ejemplo más claro de la IA como "palanca humana".

Aviso de riesgos y cláusula de exención de responsabilidad

        El mercado tiene riesgos, invertir con precaución. Este artículo no constituye un consejo de inversión personal ni considera los objetivos de inversión, situación financiera o necesidades específicas de cada usuario. Los usuarios deben considerar si las opiniones, puntos de vista o conclusiones de este artículo se ajustan a su situación particular. Cualquier inversión basada en esto es responsabilidad propia.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GateCompletesDividendDistribution
125,91K Popularidad
#
StrategyBuybackSurges12%
6,97M Popularidad
#
IsraelStrikesIranBTCPlunges
67,14K Popularidad
#
PredictWorldCupShare20000U
523,6K Popularidad
#
TrumpDisclosesOver100MBTCETH
3,83M Popularidad

Fijado

Realidad empresarial tras el reflujo de la fiebre de tokens: el control presupuestario se convierte en la nueva normalidad, pero el tren de la IA no reduce la velocidad.

Historias de portada exageradas, datos reales más moderados

El control presupuestario se convierte en la nueva norma, pero los estándares son muy diversos

Las reglas de supervivencia de los empleados para "ahorrar tokens"

La demanda de tokens baratos sigue creciendo, el mercado de TaaS/API endpoints no se ha enfriado

La codificación sigue siendo la necesidad más fuerte, el tren de la IA no se ha ralentizado por los límites presupuestarios

El verdadero ROI de la IA: aumento de eficiencia, pero también aumentan las expectativas de producción

Temas de actualidad

GateCompletesDividendDistribution

StrategyBuybackSurges12%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

TrumpDisclosesOver100MBTCETH

Fijado