DeepSeek esta pistola ya está presionada contra la nuca de Silicon Valley

DeepSeek V4 Lanzamiento unos días después, en Silicon Valley ha estado fermentando, también ha traído varias discusiones más agudas: eficiencia del modelo, patrón de chips, momento del IPO, presión de código abierto sobre el cerrado.

El 29 de abril, un vlog de Silicon Valley 101, invitó al arquitecto de chips Xiao Zhibin y a la ex investigadora de OpenAI Jenny Xiao, quienes conversaron durante más de una hora, explicando todo el asunto a fondo.

Superados por el código abierto, tu valor comercial llega a cero

La frase más dura en la entrevista fue un concepto que Jenny propuso el año pasado: —línea de muerte (kill line),la línea de muerte que los modelos de código abierto dibujan para las empresas de modelos base cerrados.

"Si eres una empresa de modelos base y te superan con código abierto, el valor de tu negocio es esencialmente cero."

Si eres una empresa de modelos base y te superan con código abierto, tu valor comercial llega a cero.

Esto no es competencia técnica, es una línea de vida o muerte.

Jenny puso un ejemplo con Anthropic: si algún día Claude deja de ser el mejor modelo para programación, ¿quién seguirá usando Claude Code?

Siguiendo esa lógica, el 24 de abril, con el lanzamiento de DeepSeek V4, todas las acciones y valoraciones de las empresas cerradas en Silicon Valley enfrentan una pregunta existencial: ¿Tu modelo todavía vale ese precio?

Hablando en términos de precio, lo más directo:

GPT-5.5 cuesta el doble que GPT-5.4, la versión Pro de textos largos cuesta 180 dólares por millón de tokens.

El mismo día, se lanzó DeepSeek V4. Con un precio de entrada 1 yuan por millón de tokens, y salida 24 yuan por millón de tokens. La versión Flash aún más agresiva: entrada 0.2 yuan por millón de tokens, salida 2 yuan por millón de tokens.

Uno cuesta el doble, el otro diez veces más barato.

Las valoraciones de las empresas de modelos base son binarias: tu razón de ser es que tu modelo sea el más potente. Si ya no lo eres, tu valor se va a cero. Incluso si eres OpenAI.

Demasiado dinero, en realidad no ahorras

Jenny reveló en la entrevista una verdad que Silicon Valley no quiere afrontar:

"Las empresas en Silicon Valley tienen demasiado dinero, y eso en realidad reduce su motivación para optimizar la eficiencia. Los fabricantes de modelos en China, por la presión de recursos, han entrado antes en la innovación en eficiencia de tokens."

Las restricciones de recursos, en cambio, aceleran la innovación.

Desde el primer día, OpenAI creyó en "moverse rápido, romper cosas", comprando GPUs sin restricciones, construyendo infraestructura a toda velocidad. Anthropic, en cambio, fue más cautelosa, temerosa de que los ingresos no siguieran el ritmo y de que los costos de adquisición los ahogaran.

¿El resultado? Con ingresos similares, la eficiencia de capital de Anthropic es claramente superior a la de OpenAI.

Y aún más complicado, OpenAI está en varias líneas de batalla: hardware, desarrollo propio de chips, aplicaciones de compras, pero la experiencia principal de ChatGPT no está a la altura. Desde finales del año pasado, han ido recortando proyectos secundarios, incluyendo Sora.

La mentalidad de los inversores ha cambiado radicalmente. Antes veían a las empresas de IA como "una curva en crecimiento exponencial, seguir invirtiendo". Ahora preguntan:

"¿Qué beneficios marginales obtenemos si invertimos otros 10, 100 mil millones? ¿Dónde está el ROI?"

DeepSeek da una respuesta muy clara: seguir ampliando la infraestructura puede ya no ser rentable.

La innovación siempre es impulsada por la necesidad. La economía de recursos en sí misma es la base de la revolución tecnológica.

Cada revolución industrial no solo se impulsa por la tecnología, sino también por cuánto cuesta esa tecnología. Solo cuando la tecnología sea lo suficientemente barata para que la use la gente común, podrá cambiar verdaderamente el mundo.

Sin eficiencia, la AGI solo será una demo

Zhao Zhibin, tras leer el documento de V4, piensa: "La dirección era previsible, pero la ejecución fue sorprendentemente completa."

Todas las optimizaciones tecnológicas de V4 apuntan a un mismo objetivo: —eficiencia en tokens (token efficiency)—.

Utilizó tres herramientas:

• Optimizador Muon: reemplaza algunos módulos de entrenamiento tradicionales Adam, acelerando aún más la convergencia.

Estas tres cosas juntas apuntan a un mismo resultado: el costo de generación por token es menor, y el uso de memoria en cada inferencia también.

El costo computacional se redujo a un tercio del de los modelos en Silicon Valley, y el uso de memoria a una décima.

Pero lo que realmente hace que V4 sea aterrador, va mucho más allá de solo "ahorrar dinero".

Jenny en la entrevista reiteró: en la era de los chatbots, el consumo de tokens es limitado, y los usuarios toleran modelos un poco más caros. Pero en la era de los agentes, la lógica es otra: tareas largas, descomposición, llamadas a múltiples herramientas, reflexión y planificación repetidas, consumen de 10 a 100 veces más tokens que un chatbot.

Si cada token cuesta mucho, el modelo no podrá pensar en profundidad durante mucho tiempo, ni atender a gran escala a los usuarios.

Por eso, ella lanzó esa frase clave:

Sin eficiencia, la AGI solo será una demo. Con eficiencia, la AGI puede convertirse en un producto real.

En la era de los agentes, la eficiencia misma es parte de la inteligencia.

¿Por qué Anthropic puede superar a OpenAI y llegar a 1 billón de dólares? Enfocarse > hacer de todo

Recientemente, la valoración de Anthropic superó a la de OpenAI, alcanzando ¡1 billón de dólares!

Jenny enumeró tres razones, pero en esencia son cinco palabras: enfocarse > hacer de todo.

Primero, Claude Code.

¿Por qué Claude Code marca el "momento definitorio" de Anthropic?

El modelo de Anthropic siempre fue muy bueno, pero Claude Code es realmente el producto que impulsa los ingresos. Peter Steinberger, fundador de OpenClaw, escribió un artículo titulado: "Claude Code es mi computadora".

Una vez que el modelo puede programar, puede realizar tareas generales: actualizar CRM, reenviar correos, automatizar procesos, todo basado en código.

Jenny tiene una visión aguda: programar es el paso más importante hacia la AGI. Quien domine la programación, puede convertirse en el líder en la era de la AGI.

Segundo, confianza empresarial.

Los clientes empresariales en el fondo repiten la misma frase: eligen a Anthropic porque tiene compromiso de seguridad. Además, por el caso de la demanda contra el Pentágono, las empresas han aceptado la señal que transmite.

Tercero, no hacer cosas innecesarias.

OpenAI quiso hacer "todo para todos", pero eso dispersó sus esfuerzos y perdió liderazgo técnico. Anthropic se enfoca en tres líneas: seguridad, empresas y programación.

Los inversores en Silicon Valley creen en una lógica: los ingresos empresariales son prioritarios sobre los de consumo. La concentración de ingresos en empresas para Anthropic es justo la historia que más gusta en el mercado estadounidense.

Nvidia: seguridad a corto plazo, mercado de inferencia a largo plazo inevitablemente se dividirá

Hablando de chips, ahora todos piensan que DeepSeek está en un proceso de "des-Nvidia-ización".

Pero la realidad es más matizada.

Fase de entrenamiento: El enorme volumen de preentrenamiento de V4, sin duda, se realizó en grandes clústeres de Nvidia. En la página 16 y 20 del informe técnico de V4, se mencionan operadores clave como TCGenO5 y MegaMoE², todos profundamente integrados en el ecosistema CUDA.

Fase de adaptación: Huawei Ascend promociona "adaptación y reentrenamiento en 0 días", AMD promociona "integración y optimización en ROCm".

Presta atención a una palabra clave: —"adaptación".

Esto significa que el modelo ya fue entrenado y definido en clústeres de Nvidia. Lo que hacen Ascend y AMD es usar su propio software para "conectar" ese modelo ya entrenado. Es una compatibilidad hacia atrás, no un sustituto nativo.

Desde esta perspectiva, a corto plazo, la barrera de Nvidia en entrenamiento es más profunda de lo que muchos piensan. El ecosistema CUDA no se puede mover en uno o dos años.

Pero a largo plazo, ¿qué pasa? El mercado de inferencia sí está en movimiento.

Tras reducir los costos de atención a contextos largos en V4, la barrera para la inferencia a gran escala se ha reducido mucho. Ya no se trata de "quien tenga más tarjetas gana", sino de "quien tenga una arquitectura compatible". Google TPU, AMD, chips propios de los proveedores de nube, incluso la computación china, buscan oportunidades en esta línea.

La señal "80/20" que mantiene a Silicon Valley despierto

Jenny tiene un dato en su portafolio: el 80% de las tareas se ejecutan en modelos open source pequeños y medianos. Solo el 20% más complejo requiere modelos cerrados.

Hace un año, nadie creía en esa proporción.

Ahora, en Silicon Valley, todos los días ven noticias como: "Tenemos 10 millones de dólares en acciones de OpenAI, ¿su fondo las compra? ¿Conoce a alguien que las compre?"

El 29 de abril, en el episodio final de Silicon Valley 101, Jenny sentenció:

"DeepSeek es como un arma apuntada a la espalda de las empresas de modelos en Silicon Valley. Si no corren lo suficiente, DeepSeek los alcanzará y destruirá sus negocios por completo."

Esa arma ya está cargada.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado