¿cuánto puede obtener la compañía de módulos ópticos de la tarifa de suscripción que le entregaste a Claude?

Resumen

· Diagrama de desglose del costo de suscripción de Claude 20 dólares, que divide una tarifa mensual de IA en modelos, computación en la nube, GPU, electricidad y cadena de suministro.

· La suscripción de IA tiene costos continuos de inferencia, no se puede aplicar directamente la hipótesis de altos márgenes de SaaS tradicional.

· Activos relacionados: OpenAI, Anthropic, Microsoft, Amazon, Google, Nvidia (NVDA), TSMC, SK Hynix, Samsung, Micron, centros de datos y cadena eléctrica.

Una estimación que desglosa aproximadamente 20 dólares mensuales de Claude Pro en EE. UU. en modelos, computación en la nube, depreciación de GPU, electricidad y cadena de suministro, está haciendo que los inversores reconsideren cómo valorar los ingresos de las aplicaciones de IA.

Esta gráfica no es un desglose oficial de Anthropic, Amazon Cloud o Nvidia, ni debe tomarse como los libros contables reales de ninguna compañía. Su valor radica en plantear una cuestión más fundamental: ¿cuánto del pago de suscripción que hacen los usuarios a las aplicaciones de IA puede consolidarse como margen bruto de software, como en SaaS tradicional?

La valoración de SaaS tradicional es bastante clara. Después de desarrollar el software, vender una cuenta adicional generalmente no implica costos elevados, y los márgenes de empresas maduras de software puro suelen estar en torno al 70% o incluso 80%. Los inversores están dispuestos a pagar múltiplos altos porque, a medida que la escala de ingresos crece, la rentabilidad puede seguir mejorando.

El problema con las aplicaciones de IA es que cada pregunta, escritura de código, análisis de archivos o llamada a un agente consume tiempo de GPU, electricidad, ancho de banda de memoria y recursos en la nube. Aunque parece una tarifa fija mensual, en realidad hay una cadena de costos que varía con el uso. Los usuarios ligeros pueden tener márgenes altos, pero los usuarios intensivos que superan los límites o usan paquetes de herramientas relacionados pueden experimentar costos rápidamente crecientes.

Por lo tanto, el diagrama de desglose de 20 dólares no busca determinar cuánto dinero se lleva cada compañía, sino cuestionar si los ingresos de las aplicaciones de IA son intrínsecamente iguales a los ingresos de SaaS. Las empresas de IA deben demostrar que valen múltiplos altos, no solo que los usuarios están dispuestos a pagar, sino que el margen bruto ponderado por uso puede mejorar de forma sostenida.

Una cadena de costos de inferencia detrás de la suscripción

La mayor diferencia entre la suscripción de IA y la de software convencional es que el costo marginal de "usar una vez" ya no se acerca a cero.

En SaaS tradicional, agregar una cuenta adicional para un equipo implica costos de servidores, soporte y ancho de banda, pero estos generalmente no aumentan linealmente con cada clic. Lo realmente costoso son la investigación, desarrollo, ventas y adquisición de clientes iniciales. Una vez que el producto escala, una parte significativa de los ingresos adicionales puede mantenerse.

Los productos de modelos grandes son diferentes. Cuando un usuario ingresa una pregunta, el modelo genera una respuesta, proceso llamado inferencia, que es el cálculo real cuando el modelo es llamado por el usuario. Token es la unidad básica de medición para leer y escribir texto en el modelo. Cuanto más preguntas, más contexto, y más contenido generado, mayor será el consumo de tokens y potencia de cálculo.

Esto crea una contradicción entre costos fijos de suscripción y costos variables. La suscripción de aproximadamente 20 dólares mensuales en EE. UU. para Claude Pro puede variar por región, impuestos y ajustes de Anthropic. Los usuarios ven un precio fijo, pero la empresa enfrenta comportamientos de uso muy diferentes: algunos solo envían correos o buscan información, otros procesan documentos largos, ejecutan código o llaman a procesos automatizados más complejos.

El diagrama de desglose popular intenta visualizar esto: dentro de los 20 dólares, una parte va a la empresa del modelo, otra a los proveedores de computación en la nube y recursos relacionados. Los costos de computación incluyen electricidad, mantenimiento y depreciación de GPU. La compra de GPU se relaciona con Nvidia, TSMC, proveedores de memoria HBM, módulos ópticos, ODM y empresas de energía.

Aquí, la "depreciación de GPU" puede entenderse como que las GPU costosas no se amortizan de una sola vez, sino que se distribuyen lentamente en el tiempo según su vida útil, intensidad de uso o criterios contables. La distribución real se ve afectada por límites de paquetes, proporciones de usuarios ligeros y pesados, precios internos de los proveedores en la nube, descuentos por reserva de capacidad, utilización de GPU y vida útil de depreciación. El costo promedio no es igual al costo marginal.

Lo que los inversores deben vigilar realmente es la dirección: las empresas de IA no pueden solo divulgar el crecimiento de ingresos, sino también responder si los costos de computación detrás del crecimiento de ingresos crecen en sincronía. Si el uso se expande más rápido que la eficiencia del modelo, mayores ingresos por suscripción pueden traducirse en mayor presión sobre los márgenes brutos. Solo si la eficiencia mejora lo suficiente, las empresas de modelos pueden volver a una estructura de beneficios similar a la del software.

Infraestructura primero obtiene ingresos más seguros

En la etapa actual, el aumento en el uso de IA se refleja más directamente en infraestructura, no solo en la capa de aplicaciones.

Independientemente de si los usuarios usan Claude, ChatGPT, Gemini o agentes internos, la inferencia finalmente requiere recursos de computación, electricidad, memoria y red. La capa de aplicaciones puede cambiar, pero los recursos subyacentes son más rígidos. Mientras el uso de IA siga creciendo, aumentarán los gastos en la nube, compras de GPU, demanda de HBM y consumo eléctrico en centros de datos.

Esta es también la razón por la cual Nvidia, TSMC, SK Hynix y otros en la cadena de infraestructura continúan siendo reevaluados por el mercado. Nvidia ha mantenido márgenes altos en los últimos años, con un margen bruto GAAP y no GAAP en torno al 71%, y las previsiones futuras siguen siendo altas. Aunque algunos trimestres pueden verse afectados por gastos específicos, los informes públicos no siempre reflejan directamente la estructura de márgenes de los centros de datos de IA, pero la escasez de infraestructura con poder de fijación de precios ya se refleja en sus resultados.

El HBM es un ejemplo típico en esta cadena. No es memoria común, sino un componente clave para aceleradores de IA que soportan cálculos de alto rendimiento. A medida que aumentan el tamaño del modelo, la longitud del contexto y la demanda de inferencia concurrente, la dependencia de memoria de alta banda ancha en los chips de IA se intensifica. Las estimaciones de la cadena de suministro muestran que la proporción de HBM en los costos de la nueva generación de chips de IA aumenta, lo que explica por qué empresas como SK Hynix, Samsung y Micron están siendo reevaluadas en el ciclo de IA.

La electricidad y los centros de datos también pasan de ser costos de fondo a líneas principales de inversión. La energía consumida en una consulta de texto simple no es excesiva, pero tareas complejas como agentes, largos contextos, generación de código y múltiples rondas aumentan mucho el cálculo. Para los operadores de la nube y centros de datos, lo importante no es solo cuánta electricidad consume una consulta, sino que, con una gran cantidad de solicitudes de inferencia, la utilización del clúster, el precio de la electricidad, la refrigeración, la capacidad del centro y la conexión a la red se convierten en costos y cuellos de botella.

La ventaja en infraestructura radica en que la validación del rendimiento es más rápida. La inversión en capital en IA por parte de los proveedores de la nube ya está en marcha, los ingresos y márgenes de Nvidia se reflejan en los informes, y los pedidos y precios de los fabricantes de HBM también impactarán rápidamente en las ganancias. La mayor parte de las transacciones en la capa de aplicaciones de modelos se basan en expectativas futuras: conversión de suscripciones, penetración en empresas, ingresos por API y la posible reducción de costos futuros que libere beneficios.

Mejoras en eficiencia siguen siendo la base principal para los alcistas

Los inversores en software y en IA no están sin argumentos. La corriente de pensamiento que apuesta por la eficiencia sostiene que, aunque los costos de inferencia son altos ahora, esto es solo una fase temprana; optimizaciones en modelos, cachés, modelos pequeños, chips propios y mejor utilización de clústeres continuarán reduciendo los costos unitarios. Si los costos bajan lo suficiente, las aplicaciones de IA podrían volver a la lógica de software de altos márgenes.

Este argumento tiene fundamentos reales. Algunos modelos principales ya han reducido significativamente su costo por token en capacidades iguales o superiores. OpenAI reveló que el costo por token de GPT-4o mini cayó un 99% respecto a text-davinci-003 en etapas anteriores. La velocidad de las empresas no es exactamente la misma; Anthropic, por ejemplo, ha mostrado mejoras en la relación calidad-precio y en la estratificación de modelos, pero la tendencia del sector sigue siendo ofrecer capacidades más fuertes a menor costo.

Las empresas de modelos también tienen varias formas de mejorar la economía por unidad. Delegar tareas simples a modelos pequeños, reutilizar cachés para solicitudes frecuentes, usar modelos más fuertes para contextos largos y tareas complejas. Los proveedores en la nube reducen costos unitarios mediante chips propios y gestión de clústeres. Google tiene TPU, Microsoft lanzó Maia para inferencia, y Amazon avanza con Trainium e Inferentia.

Si solo consideramos avances tecnológicos, los márgenes de beneficio de las aplicaciones de IA tienen potencial de mejora. Inferencia más barata, mejor enrutamiento de modelos, mayor compresión, todo permite que una suscripción de 20 dólares soporte más uso. Paquetes empresariales de alto precio, precios escalonados por API y límites de uso más estrictos también pueden mejorar la economía general por unidad.

El problema es que la reducción de costos no es el único factor. Las aplicaciones de IA están pasando de simples chats a cargas de trabajo más pesadas. Antes, los usuarios solo hacían preguntas o reescribían textos; ahora, cada vez más demandas provienen de agentes de código, procesamiento de documentos largos, generación de videos y multimodalidad, automatización empresarial. Estos escenarios tienen mayor valor y consumo. Cuanto más útil sea un modelo, más probable será que los usuarios le confíen tareas más complejas y prolongadas.

Por lo tanto, la divergencia se vuelve más concreta: ¿la velocidad de reducción de costos de inferencia puede superar el crecimiento en uso y complejidad de tareas? Si los costos unitarios bajan rápidamente, pero el consumo medio de los usuarios crece aún más, los márgenes ponderados de las empresas de modelos seguirán presionados. Por otro lado, si en cambio, las estrategias de enrutamiento, caché, chips propios y precios escalonados son suficientemente efectivas, las suscripciones de IA podrían liberarse gradualmente de su carácter de alto costo actual.

Los usuarios de suscripción no determinan los márgenes

El diagrama de desglose de 20 dólares no debe interpretarse como la conclusión definitiva. Es más bien un recordatorio de valoración en la etapa actual: cuando el mercado aún no tiene datos claros sobre los márgenes de las empresas de modelos, los inversores deben descontar la hipótesis de que "las aplicaciones de IA son intrínsecamente iguales a SaaS".

Para empresas como OpenAI o Anthropic, que aún no cotizan en bolsa, a los inversores externos les resulta difícil ver libros contables completos. Materiales de financiamiento, divulgaciones de socios, estructura de costos en la nube, precios de paquetes empresariales, proporción de ingresos por API y restricciones de uso, serán pistas para juzgar. Los datos más valiosos no son cuántos usuarios pagan, sino cuántos son usuarios ligeros y pesados, si las empresas están dispuestas a pagar más por uso intensivo, si los costos en la nube bajan, y si la reducción en costos de inferencia puede mejorar los márgenes de la compañía.

Las empresas cotizadas podrán verificar esto más rápidamente en sus informes financieros. La tasa de crecimiento de los márgenes de Nvidia, los ingresos de centros de datos, la demanda de procesos avanzados en TSMC, los precios y márgenes de los fabricantes de HBM, y la inversión en la nube seguirán reflejando si el uso de IA continúa transmitiéndose a la infraestructura. Si estos indicadores permanecen fuertes, pero no hay evidencia de mejora en los márgenes de la capa de aplicaciones, el mercado seguirá valorando con mayor certeza la infraestructura.

Finalmente, para que las empresas de modelos recuperen una valoración más alta, deben demostrar que no solo los usuarios están dispuestos a pagar 20 dólares, sino que, incluso tras un uso intensivo, estos suscriptores dejan suficiente margen. La próxima divergencia en precios probablemente no estará en los números principales de ARR, sino en si los costos de inferencia, los límites de paquetes y los precios empresariales pueden mantenerse en línea.

Haz clic para conocer las vacantes en BlockBeats

Únete a la comunidad oficial de BlockBeats:

Grupo de suscripción en Telegram: https://t.me/theblockbeats

Grupo de discusión en Telegram: https://t.me/BlockBeats_App

Cuenta oficial en Twitter: https://twitter.com/BlockBeatsAsia

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado