Análisis: La brecha entre los modelos de código abierto y los de código cerrado de vanguardia de China y Estados Unidos se ha reducido a solo 3 a 6 meses, y los costos extremadamente bajos aceleran la tendencia global de sustitución.

robot
Generación de resúmenes en curso

Según el monitoreo de Beating, el agregador de servicios OpenRouter reveló que la brecha de rendimiento entre los modelos de código abierto y los modelos fronterizos de código cerrado se ha estabilizado en 3 a 6 meses. En los últimos 18 meses, los laboratorios fronterizos de código cerrado no lograron ampliar la distancia como se esperaba, mientras que las fuerzas de código abierto representadas por nuevos actores de China y EE.UU. están acelerando la sustitución de los modelos de código cerrado con una relación calidad-precio extremadamente alta.

DeepSeek V4 Flash, lanzado hace solo dos meses, se ha convertido en la primera opción para la sustitución económica. Con 284 mil millones de parámetros, DeepSeek V4 Flash obtuvo un 79.0% en la evaluación SWE-bench Verified, acercándose al nivel de GPT-5.5. El precio oficial de entrada/salida de primera parte es de solo 0.14/0.28 USD por millón de tokens, y el costo de salida es aproximadamente 150 veces más barato que el de GPT-5.5. Incluso añadiendo la prima del alojamiento en la nube occidental que no conserva los datos de entrenamiento, el costo real es solo alrededor del 1.3% de los modelos fronterizos de código cerrado.

Además de la ventaja de precio, el GLM 5.2 lanzado por Zhipu en junio de 2026 ocupó el primer lugar en el índice de inteligencia de peso abierto de Artificial Analysis, y se equiparó al nivel de GPT-5.5 en las evaluaciones de agentes reales, convirtiéndose en una opción de reemplazo para la planificación de programación de larga duración. Sin embargo, el GLM 5.2 consume muchos tokens durante el pensamiento profundo, por lo que las empresas deben equilibrar el costo de salida al implementarlo. El modelo multimodal de código abierto MiniMax M3, con su innovadora arquitectura de atención dispersa MSA, proporciona capacidad de procesamiento de contexto largo para imágenes y video nativos a un precio de token bajo, convirtiéndose en un fuerte competidor de código abierto para Gemini Flash.

Al mismo tiempo, el Nemotron 3 Ultra de NVIDIA, basado en la arquitectura híbrida Mamba-2, se ha convertido en la fuerza de código abierto estadounidense más fuerte, con el objetivo de impulsar la demanda del mercado del ecosistema de hardware y microservicios de NVIDIA a través de un ecosistema abierto.

OpenRouter enfatizó que, aunque los modelos fronterizos de código cerrado eventualmente seguirán avanzando, el costo de los tokens para un nivel fijo de inteligencia seguirá disminuyendo, brindando a las empresas un espacio significativo para la optimización de costos.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios