¡La potencia de cálculo está muy escasa! La tarifa de alquiler del H100, lanzado por NVIDIA hace cuatro años, ha aumentado casi un 40% en los últimos seis meses.

robot
Generación de resúmenes en curso

Con motivo de la llegada de un nuevo año, gigantes de la IA como Anthropic y ByteDance siguen lanzando aplicaciones superventas, y además se suma la fiebre de los “camarones”, que impulsa un aumento explosivo en el uso de modelos de código abierto; en este contexto, el chip H100 de Nvidia vive un momento de brillo con un “rebote en V” en su valor en el mercado de alquiler.

Para saberlo, este chip es un producto que Huang Renxun presentó en el GTC de marzo de 2022 y que empezó a enviarse en el otoño del mismo año.

Según el índice de precios de contratos de alquiler a un año del H100 lanzado el jueves por la firma de investigación de semiconductores SemiAnalysis, después de que el “chip antiguo” tocara 1.7 dólares por hora en octubre de 2025, ya en marzo de este año se disparó a 2.35 dólares por hora por cada GPU, con un aumento de casi 40%.

(Fuente: SemiAnalysis)

El índice se construye a partir de datos de una encuesta directa a más de 100 proveedores de servicios en la nube, compradores y vendedores de recursos de cómputo, realizada una vez al mes.

El informe más reciente señala que la potencia de cómputo de GPU bajo demanda ya se ha agotado en todos los tipos de GPU: incluso si los precios han subido recientemente, los clientes que ya tienen instancias bajo demanda bloqueadas no quieren liberar esa potencia de cómputo de vuelta al pool de recursos. La institución también lo compara diciendo que buscar potencia de GPU a inicios de 2026 es como intentar reservar boletos de avión para el “último vuelo que sale”: precios elevados y casi sin recursos disponibles.

Los investigadores agregaron: “Los clientes están pujando por comprar las instancias de puja p6-b200 del servicio en la nube de Amazon a un precio de 14 dólares por cada GPU por hora; algunos gigantes emergentes de servicios en la nube (Neocloud Giants) incluso ya no ofrecen ventas de un solo nodo; algunas GPU Nvidia H100 todavía se renuevan al precio original con el que se firmaron hace 2 a 3 años, e incluso algunos contratos de H100 se han renovado directamente hasta 2028.”

¿Y qué hay de los chips Blackwell, más avanzados en arquitectura? Los investigadores señalaron que, debido a la fuerte demanda de modelos de pesos abiertos y al aumento sostenido de la demanda de inferencia, el periodo de entrega de nuevas implementaciones de Blackwell ahora se ha extendido a 6 a 7 meses.

A finales de 2025, el mercado llegó a anticipar que, con el despliegue acelerado de los chips Blackwell, más potentes y con menor costo de cómputo, los precios de alquiler de los chips Hopper (H100, H200) podrían caer de forma significativa. Pero la situación más reciente es todo lo contrario: ahora la demanda de H100 no solo se mantiene firme, sino que en muchos casos incluso está aumentando.

En su informe, SemiAnalysis señaló que, entre los principales impulsores de la demanda de cómputo a principios de este año, está la generación nativa de contenido multimedia. Por ejemplo, durante la generación y optimización masiva de video/imagen impulsada por Seedance de ByteDance (es decir, Meng) y Nano Banana de Google, el rendimiento de tokens (token throughput) aumentó de forma marcada. La fuente de demanda más destacada proviene del auge de cargas de trabajo de múltiples agentes (multi-agent), que impulsa un crecimiento parabólico en el uso de tokens y el consumo de cómputo.

SemiAnalysis dijo que solo ellos mismos “en la última semana consumieron miles de millones de tokens”, y que el costo por cada millón de tokens ronda los 5 dólares. Sin embargo, la compañía también se mostró satisfecha al señalar que el retorno derivado del tiempo ahorrado y de la expansión de los flujos de trabajo y la capacidad supera con creces el costo de cómputo.

El informe también indicó que el dinámico ajuste de la oferta de cómputo y el aumento de precios están desacoplados del estado de ánimo general del mercado. Las acciones de proveedores emergentes de servicios en la nube como CoreWeave y Nebius están en el extremo bajo del rango de los últimos 6 a 12 meses. El análisis apunta a que el mercado todavía está anclado al marco narrativo de “al final habrá exceso de oferta y la computación se convertirá en un commodity”. Pero la realidad es que, bajo un entorno de tensión agresiva de la oferta, prácticamente todo tipo de recursos de cómputo mantendrá una demanda vigorosa, independientemente de sus diferencias relativas de rendimiento.

De cara al futuro, los investigadores plantearon tres puntos clave de observación para evaluar si los precios de alquiler de GPU seguirán manteniéndose altos.

En primer lugar, a medida que los clústeres GB300 se desplieguen gradualmente durante todo 2026, el mercado prestará atención a si la nueva oferta podrá aliviar el actual cuello de botella de disponibilidad de cómputo. En segundo lugar, habrá que observar si el déficit continuo de chips empeora aún más. Por último, también conviene vigilar la expansión de los ingresos recurrentes anuales (ARR) de los principales gigantes de la IA, y el ritmo sostenido de crecimiento tanto en la adopción de aplicaciones de IA como en la escala del consumo de tokens.

(Fuente del artículo: Caixin)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado