Goldman Sachs: ¿Qué significa DeepSeek V4 para la IA en China?

Autor: Bao Yilong, Wall Street Insights

Goldman Sachs considera que, el significado central de DeepSeek V4 radica en apoyar aplicaciones de agentes más complejos con costos más bajos, abriendo así un nuevo espacio para la escalabilidad de las aplicaciones de IA.

El 24 de abril, el equipo de Ronald Keung de Goldman Sachs publicó un informe de investigación, donde el nuevo modelo V4 de código abierto continúa la línea de eficiencia y apertura de DeepSeek.

En términos tecnológicos, V4 logra una reducción significativa de costos en ventanas de contexto largas mediante una actualización de arquitectura, y apuesta claramente por los chips nacionales de Huawei. En el mercado, este lanzamiento acelera la competencia en modelos de IA en China, donde la capacidad de programación, la tasa de cumplimiento de tareas y la multimodalidad se convertirán en los principales diferenciadores en la fijación de precios.

Goldman Sachs mantiene su recomendación sobre los sectores de computación en la nube y centros de datos, ya que la mejora continua en la eficiencia de costos de computación impulsará una mayor penetración de las aplicaciones de IA, con un crecimiento doble impulsado por los agentes de IA en empresas y los asistentes de IA en consumidores, lo que sustentará una mejora continua en la capacidad de fijación de precios de los servicios en la nube.

Actualización de arquitectura V4, soportando contextos más largos con menos memoria

DeepSeek V4 se lanza en dos versiones: Pro y Flash.

La versión Pro es de escala insignia, con 1.6 billones de parámetros (490 millones de parámetros activos); la versión Flash es más ligera, con 284 mil millones de parámetros (130 millones de parámetros activos). Ambas soportan ventanas de contexto de 1 millón de palabras, iguales a los modelos líderes en EE. UU. (SOTA), pero con un uso de memoria y caché KV significativamente reducido.

Según el informe de Goldman Sachs, V4 Pro en escenarios de 1 millón de palabras requiere solo el 27% de las operaciones de punto flotante (FLOPs) en comparación con DeepSeek V3.2, y solo el 10% de la caché KV; V4 Flash es aún más agresivo, con FLOPs reducidos al 10% y caché KV comprimida al 7%.

Este salto en eficiencia se logra gracias a tres innovaciones clave en la arquitectura:

  • En cuanto a mecanismos de atención híbridos, V4 introduce una arquitectura combinada de atención dispersa comprimida (CSA) y atención comprimida intensiva (HCA). CSA comprime la caché KV en la dimensión de secuencia antes de realizar cálculos de atención dispersa, mientras que HCA emplea una compresión más agresiva pero mantiene la atención densa, colaborando para reducir en gran medida la memoria temporal necesaria para entradas largas.

  • En términos de estabilidad de entrenamiento, V4 introduce el mecanismo mHC, que mejora la transmisión de información en múltiples capas de la red;

  • Además, utiliza Muon como optimizador principal de entrenamiento (manteniendo algunos módulos con AdamW), para adaptarse a arquitecturas de red más complejas que V3, mejorando la calidad de la convergencia durante el entrenamiento.

Goldman Sachs señala que estas mejoras en eficiencia son especialmente relevantes en tareas de larga duración, como tareas de agentes que requieren procesar grandes cantidades de contexto en ciclos largos.

Cabe destacar que, actualmente, DeepSeek sigue centrado en modelos de texto básicos, mientras que gigantes de internet como Alibaba, ByteDance, MiniMax y otros jugadores independientes prefieren rutas multimodales o de modalidad completa, mostrando una clara diferenciación en la exploración de la AGI.

Chips nacionales aceleran su implementación, Huawei Ascend 950 allana el camino para reducir precios

Otra señal importante del lanzamiento de V4 es que DeepSeek ha dejado claro que la producción en masa del nodo superpotente Huawei Ascend 950 forma parte de su estrategia comercial.

DeepSeek estima que a medida que Huawei logre una oferta masiva del nodo superpotente Ascend 950 en la segunda mitad de 2026, los precios de la API de la versión V4 Pro disminuirán significativamente.

El informe de Goldman Sachs indica que esta declaración tiene un doble significado:

Primero, la competitividad en costos de DeepSeek se fortalecerá aún más, creando condiciones para una adopción más amplia; segundo, en un contexto de escasez continua de chips, la tendencia de migración de modelos de IA líderes en China hacia infraestructura de computación nacional recibe un respaldo claro de los principales actores.

Según los precios actuales, Goldman Sachs muestra que el precio de V4 Pro en plataformas API principales ya es competitivo, y con la expansión de la oferta de capacidad de computación nacional, se espera que esta ventaja se amplíe aún más en la segunda mitad de 2026.

La competencia en modelos de IA nacionales entra en una fase de diferenciación

El lanzamiento de código abierto de DeepSeek ha desencadenado rápidamente una nueva ronda de seguimiento intensivo en el campo de los modelos de IA en China.

Según Goldman Sachs, los actores que han lanzado nuevos modelos recientemente incluyen: Kimi K2.6, Alibaba Qwen3.6-Max, Tencent Hy3 (versión preliminar), Xiaomi V2.5, y se espera que MiniMax M3/Hailuo se lance en mayo.

Para Goldman Sachs, los factores clave que determinarán la capacidad de fijación de precios de los modelos en el futuro se concentrarán en dos dimensiones:

Tasa de éxito en programación / cumplimiento de tareas, donde el modelo GLM de Zhispan ocupa una posición destacada en capacidades de código;
Capacidades multimodales, en las que ByteDance, Alibaba y MiniMax invierten de manera más profunda.

El informe señala que los dos tipos de actores tienen ventajas y desventajas claras:

Los jugadores independientes de IA, como MiniMax, tienen alta eficiencia organizacional y cadenas de decisión cortas, y aunque los precios de las API de texto básico sean muy bajos, aún pueden lograr un margen bruto del 40%, según predicciones de Goldman Sachs.
Las grandes empresas de internet, como ByteDance, Tencent y Alibaba, tienen flujos de efectivo sólidos en sus negocios principales, por lo que es más conveniente que inviertan en infraestructura de IA y en el sector de la nube, estableciendo equipos de IA independientes con planes de incentivos para retener talento, como el equipo de Doubao de ByteDance, que ya cuenta con incentivos independientes.

Es importante destacar que, según un informe de Goldman Sachs, noticias indican que Tencent y Alibaba están en negociaciones para invertir en DeepSeek con una valoración superior a 20 mil millones de dólares, mientras que Zhispan y MiniMax tienen valoraciones recientes de aproximadamente 53 mil millones y 31 mil millones de dólares, respectivamente, reflejando en estas potenciales transacciones la lógica de competencia por capacidades de IA de alto nivel y escasas.

La lógica de los principales caminos de elección: cloud y centros de datos

Goldman Sachs mantiene su evaluación de que los sectores de computación en la nube y centros de datos siguen siendo las principales áreas de interés en China, basándose en:

La demanda creciente de tokens de IA impulsará la compra de servicios en la nube;

El crecimiento de clientes empresariales y agentes de IA mejorará la capacidad de fijación de precios en la nube y en tokens;

La penetración continua de asistentes de IA en consumo contribuirá a una mayor demanda incremental.

En el mercado de nube para empresas, Alibaba lidera con la mayor escala de ingresos externos en IA; en el mercado de consumo, ByteDance actualmente es la plataforma con mayor uso diario de tokens en chatbots de IA, y las aplicaciones de AIGC en China mantienen un crecimiento fuerte en DAU, con un aumento mensual del 36% en marzo de 2026.

En cuanto a las acciones clave, Goldman Sachs continúa recomendando a GDS, Century Internet, Alibaba y Kingsoft Cloud como las principales opciones para aprovechar los beneficios de la expansión de la infraestructura de IA en China.

Además, la segunda capa incluye empresas en comercio electrónico y movilidad, mientras que la tercera capa abarca acciones relacionadas con modelos de IA, y la cuarta capa se centra en juegos y entretenimiento.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado