Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
CFD
Derivados de CFD de acciones estadounidenses
Acciones EE. UU.
Accede a acciones y ETF estadounidenses reales
Acciones HK
Opera con acciones de calidad cotizadas en Hong Kong
Futuros de acciones
Alto apalancamiento, trading 24/7
Acciones tokenizadas
Respaldado por acciones reales
IPO Access
Accede al acceso completo a las OPV de acciones globales
GUSD
Acuña GUSD para obtener rendimientos de RWA del Tesoro
Actividades de acciones
Opera con acciones populares y desbloquea grandes airdrops
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
IPO Access
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
USD1 Gana por holdear
Sin bloqueo, opera y retira
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
¿cuánto puede obtener la compañía de módulos ópticos de la tarifa de suscripción que le entregaste a Claude?
Resumen
Una estimación que desglosa aproximadamente 20 dólares mensuales de Claude Pro en EE. UU. en modelos, computación en la nube, depreciación de GPU, electricidad y cadena de suministro, está haciendo que los inversores reconsideren cómo valorar los ingresos de las aplicaciones de IA.
Esta gráfica no es un desglose oficial de Anthropic, Amazon Cloud o Nvidia, ni debe tomarse como los libros contables reales de ninguna compañía. Su valor radica en plantear una cuestión más fundamental: ¿cuánto del pago de suscripción que hacen los usuarios a las aplicaciones de IA puede consolidarse como margen bruto de software, como en SaaS tradicional?
La valoración de SaaS tradicional es bastante clara. Después de desarrollar el software, vender una cuenta adicional generalmente no implica costos elevados, y los márgenes de empresas maduras de software puro suelen estar en torno al 70% o incluso 80%. Los inversores están dispuestos a pagar múltiplos altos porque, a medida que la escala de ingresos crece, la rentabilidad puede seguir mejorando.
El problema con las aplicaciones de IA es que cada pregunta, escritura de código, análisis de archivos o llamada a un agente consume tiempo de GPU, electricidad, ancho de banda de memoria y recursos en la nube. Aunque parece una tarifa fija mensual, en realidad hay una cadena de costos que varía con el uso. Los usuarios ligeros pueden tener márgenes altos, pero los usuarios intensivos que superan los límites o usan paquetes de herramientas relacionados pueden experimentar costos rápidamente crecientes.
Por lo tanto, el diagrama de desglose de 20 dólares no busca determinar cuánto dinero se lleva cada compañía, sino cuestionar si los ingresos de las aplicaciones de IA son intrínsecamente iguales a los ingresos de SaaS. Las empresas de IA deben demostrar que valen múltiplos altos, no solo que los usuarios están dispuestos a pagar, sino que el margen bruto ponderado por uso puede mejorar de forma sostenida.
Una cadena de costos de inferencia detrás de la suscripción
La mayor diferencia entre la suscripción de IA y la de software convencional es que el costo marginal de "usar una vez" ya no se acerca a cero.
En SaaS tradicional, agregar una cuenta adicional para un equipo implica costos de servidores, soporte y ancho de banda, pero estos generalmente no aumentan linealmente con cada clic. Lo realmente costoso son la investigación, desarrollo, ventas y adquisición de clientes iniciales. Una vez que el producto escala, una parte significativa de los ingresos adicionales puede mantenerse.
Los productos de modelos grandes son diferentes. Cuando un usuario ingresa una pregunta, el modelo genera una respuesta, proceso llamado inferencia, que es el cálculo real cuando el modelo es llamado por el usuario. Token es la unidad básica de medición para leer y escribir texto en el modelo. Cuanto más preguntas, más contexto, y más contenido generado, mayor será el consumo de tokens y potencia de cálculo.
Esto crea una contradicción entre costos fijos de suscripción y costos variables. La suscripción de aproximadamente 20 dólares mensuales en EE. UU. para Claude Pro puede variar por región, impuestos y ajustes de Anthropic. Los usuarios ven un precio fijo, pero la empresa enfrenta comportamientos de uso muy diferentes: algunos solo envían correos o buscan información, otros procesan documentos largos, ejecutan código o llaman a procesos automatizados más complejos.
El diagrama de desglose popular intenta visualizar esto: dentro de los 20 dólares, una parte va a la empresa del modelo, otra a los proveedores de computación en la nube y recursos relacionados. Los costos de computación incluyen electricidad, mantenimiento y depreciación de GPU. La compra de GPU se relaciona con Nvidia, TSMC, proveedores de memoria HBM, módulos ópticos, ODM y empresas de energía.
Aquí, la "depreciación de GPU" puede entenderse como que las GPU costosas no se amortizan de una sola vez, sino que se distribuyen lentamente en el tiempo según su vida útil, intensidad de uso o criterios contables. La distribución real se ve afectada por límites de paquetes, proporciones de usuarios ligeros y pesados, precios internos de los proveedores en la nube, descuentos por reserva de capacidad, utilización de GPU y vida útil de depreciación. El costo promedio no es igual al costo marginal.
Lo que los inversores deben vigilar realmente es la dirección: las empresas de IA no pueden solo divulgar el crecimiento de ingresos, sino también responder si los costos de computación detrás del crecimiento de ingresos crecen en sincronía. Si el uso se expande más rápido que la eficiencia del modelo, mayores ingresos por suscripción pueden traducirse en mayor presión sobre los márgenes brutos. Solo si la eficiencia mejora lo suficiente, las empresas de modelos pueden volver a una estructura de beneficios similar a la del software.
Infraestructura primero obtiene ingresos más seguros
En la etapa actual, el aumento en el uso de IA se refleja más directamente en infraestructura, no solo en la capa de aplicaciones.
Independientemente de si los usuarios usan Claude, ChatGPT, Gemini o agentes internos, la inferencia finalmente requiere recursos de computación, electricidad, memoria y red. La capa de aplicaciones puede cambiar, pero los recursos subyacentes son más rígidos. Mientras el uso de IA siga creciendo, aumentarán los gastos en la nube, compras de GPU, demanda de HBM y consumo eléctrico en centros de datos.
Esta es también la razón por la cual Nvidia, TSMC, SK Hynix y otros en la cadena de infraestructura continúan siendo reevaluados por el mercado. Nvidia ha mantenido márgenes altos en los últimos años, con un margen bruto GAAP y no GAAP en torno al 71%, y las previsiones futuras siguen siendo altas. Aunque algunos trimestres pueden verse afectados por gastos específicos, los informes públicos no siempre reflejan directamente la estructura de márgenes de los centros de datos de IA, pero la escasez de infraestructura con poder de fijación de precios ya se refleja en sus resultados.
El HBM es un ejemplo típico en esta cadena. No es memoria común, sino un componente clave para aceleradores de IA que soportan cálculos de alto rendimiento. A medida que aumentan el tamaño del modelo, la longitud del contexto y la demanda de inferencia concurrente, la dependencia de memoria de alta banda ancha en los chips de IA se intensifica. Las estimaciones de la cadena de suministro muestran que la proporción de HBM en los costos de la nueva generación de chips de IA aumenta, lo que explica por qué empresas como SK Hynix, Samsung y Micron están siendo reevaluadas en el ciclo de IA.
La electricidad y los centros de datos también pasan de ser costos de fondo a líneas principales de inversión. La energía consumida en una consulta de texto simple no es excesiva, pero tareas complejas como agentes, largos contextos, generación de código y múltiples rondas aumentan mucho el cálculo. Para los operadores de la nube y centros de datos, lo importante no es solo cuánta electricidad consume una consulta, sino que, con una gran cantidad de solicitudes de inferencia, la utilización del clúster, el precio de la electricidad, la refrigeración, la capacidad del centro y la conexión a la red se convierten en costos y cuellos de botella.
La ventaja en infraestructura radica en que la validación del rendimiento es más rápida. La inversión en capital en IA por parte de los proveedores de la nube ya está en marcha, los ingresos y márgenes de Nvidia se reflejan en los informes, y los pedidos y precios de los fabricantes de HBM también impactarán rápidamente en las ganancias. La mayor parte de las transacciones en la capa de aplicaciones de modelos se basan en expectativas futuras: conversión de suscripciones, penetración en empresas, ingresos por API y la posible reducción de costos futuros que libere beneficios.
Mejoras en eficiencia siguen siendo la base principal para los alcistas
Los inversores en software y en IA no están sin argumentos. La corriente de pensamiento que apuesta por la eficiencia sostiene que, aunque los costos de inferencia son altos ahora, esto es solo una fase temprana; optimizaciones en modelos, cachés, modelos pequeños, chips propios y mejor utilización de clústeres continuarán reduciendo los costos unitarios. Si los costos bajan lo suficiente, las aplicaciones de IA podrían volver a la lógica de software de altos márgenes.
Este argumento tiene fundamentos reales. Algunos modelos principales ya han reducido significativamente su costo por token en capacidades iguales o superiores. OpenAI reveló que el costo por token de GPT-4o mini cayó un 99% respecto a text-davinci-003 en etapas anteriores. La velocidad de las empresas no es exactamente la misma; Anthropic, por ejemplo, ha mostrado mejoras en la relación calidad-precio y en la estratificación de modelos, pero la tendencia del sector sigue siendo ofrecer capacidades más fuertes a menor costo.
Las empresas de modelos también tienen varias formas de mejorar la economía por unidad. Delegar tareas simples a modelos pequeños, reutilizar cachés para solicitudes frecuentes, usar modelos más fuertes para contextos largos y tareas complejas. Los proveedores en la nube reducen costos unitarios mediante chips propios y gestión de clústeres. Google tiene TPU, Microsoft lanzó Maia para inferencia, y Amazon avanza con Trainium e Inferentia.
Si solo consideramos avances tecnológicos, los márgenes de beneficio de las aplicaciones de IA tienen potencial de mejora. Inferencia más barata, mejor enrutamiento de modelos, mayor compresión, todo permite que una suscripción de 20 dólares soporte más uso. Paquetes empresariales de alto precio, precios escalonados por API y límites de uso más estrictos también pueden mejorar la economía general por unidad.
El problema es que la reducción de costos no es el único factor. Las aplicaciones de IA están pasando de simples chats a cargas de trabajo más pesadas. Antes, los usuarios solo hacían preguntas o reescribían textos; ahora, cada vez más demandas provienen de agentes de código, procesamiento de documentos largos, generación de videos y multimodalidad, automatización empresarial. Estos escenarios tienen mayor valor y consumo. Cuanto más útil sea un modelo, más probable será que los usuarios le confíen tareas más complejas y prolongadas.
Por lo tanto, la divergencia se vuelve más concreta: ¿la velocidad de reducción de costos de inferencia puede superar el crecimiento en uso y complejidad de tareas? Si los costos unitarios bajan rápidamente, pero el consumo medio de los usuarios crece aún más, los márgenes ponderados de las empresas de modelos seguirán presionados. Por otro lado, si en cambio, las estrategias de enrutamiento, caché, chips propios y precios escalonados son suficientemente efectivas, las suscripciones de IA podrían liberarse gradualmente de su carácter de alto costo actual.
Los usuarios de suscripción no determinan los márgenes
El diagrama de desglose de 20 dólares no debe interpretarse como la conclusión definitiva. Es más bien un recordatorio de valoración en la etapa actual: cuando el mercado aún no tiene datos claros sobre los márgenes de las empresas de modelos, los inversores deben descontar la hipótesis de que "las aplicaciones de IA son intrínsecamente iguales a SaaS".
Para empresas como OpenAI o Anthropic, que aún no cotizan en bolsa, a los inversores externos les resulta difícil ver libros contables completos. Materiales de financiamiento, divulgaciones de socios, estructura de costos en la nube, precios de paquetes empresariales, proporción de ingresos por API y restricciones de uso, serán pistas para juzgar. Los datos más valiosos no son cuántos usuarios pagan, sino cuántos son usuarios ligeros y pesados, si las empresas están dispuestas a pagar más por uso intensivo, si los costos en la nube bajan, y si la reducción en costos de inferencia puede mejorar los márgenes de la compañía.
Las empresas cotizadas podrán verificar esto más rápidamente en sus informes financieros. La tasa de crecimiento de los márgenes de Nvidia, los ingresos de centros de datos, la demanda de procesos avanzados en TSMC, los precios y márgenes de los fabricantes de HBM, y la inversión en la nube seguirán reflejando si el uso de IA continúa transmitiéndose a la infraestructura. Si estos indicadores permanecen fuertes, pero no hay evidencia de mejora en los márgenes de la capa de aplicaciones, el mercado seguirá valorando con mayor certeza la infraestructura.
Finalmente, para que las empresas de modelos recuperen una valoración más alta, deben demostrar que no solo los usuarios están dispuestos a pagar 20 dólares, sino que, incluso tras un uso intensivo, estos suscriptores dejan suficiente margen. La próxima divergencia en precios probablemente no estará en los números principales de ARR, sino en si los costos de inferencia, los límites de paquetes y los precios empresariales pueden mantenerse en línea.
Haz clic para conocer las vacantes en BlockBeats
Únete a la comunidad oficial de BlockBeats:
Grupo de suscripción en Telegram: https://t.me/theblockbeats
Grupo de discusión en Telegram: https://t.me/BlockBeats_App
Cuenta oficial en Twitter: https://twitter.com/BlockBeatsAsia