Analyse : l'écart entre les modèles open source et les modèles propriétaires de pointe en Chine et aux États-Unis n'est plus que de 3 à 6 mois, et un coût extrêmement faible accélère la tendance mondiale aux remplacements.

robot
Création du résumé en cours

Selon la surveillance de Beating, l'agrégateur OpenRouter a révélé que l'écart de performance entre les modèles open source et les modèles propriétaires de pointe s'est stabilisé entre 3 et 6 mois. Au cours des 18 derniers mois, les laboratoires propriétaires de pointe n'ont pas réussi à creuser l'écart comme prévu, tandis que les forces open source, représentées par les nouveaux acteurs sino-américains, accélèrent le remplacement économique des modèles propriétaires grâce à un rapport qualité-prix extrêmement élevé.

DeepSeek V4 Flash, lancé il y a seulement deux mois, est devenu le premier choix pour le remplacement économique. Avec 284 milliards de paramètres, DeepSeek V4 Flash a obtenu un score de 79,0 % dans l'évaluation SWE-bench Verified, se rapprochant du niveau GPT-5.5. La tarification officielle de première partie pour l'entrée/sortie n'est que de 0,14/0,28 dollar par million de tokens, et le coût de sortie est environ 150 fois moins cher que GPT-5.5. Même en ajoutant la prime d'hébergement cloud occidental sans conservation des données d'entraînement, le coût réel ne représente qu'environ 1,3 % de celui des modèles propriétaires de pointe.

Outre l'avantage de prix, le GLM 5.2, publié par Zhipu en juin 2026, se classe premier dans l'indice d'intelligence des poids open source d'Artificial Analysis et rivalise avec le niveau GPT-5.5 dans les évaluations d'agents réels, devenant une alternative pour la planification de programmation à long terme. Cependant, le GLM 5.2 consomme beaucoup de tokens lors de la réflexion approfondie, et les entreprises doivent équilibrer les coûts de sortie lors du déploiement. Le modèle open source multimodal MiniMax M3, grâce à son architecture innovante d'attention sparse MSA, offre des capacités de traitement de contexte long pour les images et vidéos natives à un prix de token bas, devenant un concurrent open source solide pour Gemini Flash.

Parallèlement, le Nemotron 3 Ultra de NVIDIA, basé sur l'architecture hybride Mamba-2, devient la force open source américaine la plus puissante, visant à stimuler la demande du marché pour le matériel et l'écosystème de microservices de NVIDIA via un écosystème ouvert.

OpenRouter souligne que, bien que les modèles propriétaires de pointe finissent par progresser, le coût des tokens pour un niveau d'intelligence fixe continuera de baisser, offrant aux entreprises une marge d'optimisation des coûts significative.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire