GPT 5.6 Sol, Terra, Luna : Découvrez leurs caractéristiques et prix d'un coup d'œil, et comparez avec Claude : lequel est le meilleur ?

OpenAI lance la série de modèles GPT-5.6, cet article vous présente les caractéristiques, la tarification et les frais API des familles de modèles Sol, Terra et Luna. Cependant, en raison des exigences de vérification de sécurité du gouvernement Trump, l'accès est actuellement limité à un aperçu restreint pour certains partenaires spécifiques.

Lancement surprise de GPT 5.6, accès limité suite aux exigences du gouvernement Trump

OpenAI a dévoilé le 26 juin la nouvelle série de modèles GPT-5.6, comprenant le modèle phare Sol, le modèle équilibré Terra et le modèle à haut rapport qualité-prix Luna.

Cependant, en raison des exigences de vérification de sécurité imposées par le gouvernement Trump pour les modèles d'IA de pointe, OpenAI n'offre actuellement un aperçu limité qu'à un petit nombre de partenaires de confiance, et ne le propose pas temporairement dans ChatGPT. L'accès sera progressivement élargi à l'avenir. Malgré cela, le lancement surprise de GPT-5.6, OpenAI Preview, Sol, Terra et Luna est devenu un mot-clé de recherche tendance dans le secteur technologique.

Différences entre les trois principaux modèles GPT 5.6 : Sol, Terra, Luna

La série GPT-5.6 a apporté des modifications majeures à son système de dénomination, abandonnant les anciens noms comme nano ou mini. OpenAI indique que dans le nouveau système de dénomination, les chiffres représentent la génération du modèle, tandis que Sol, Terra et Luna représentent des niveaux de capacité durables développés indépendamment, afin d'offrir aux entreprises et aux développeurs un choix plus clair entre performances intelligentes, vitesse et coût.

Bien que pour les amateurs de crypto, Sol fasse facilement penser à la blockchain Layer 1 Solana ($SOL), et Terra et Luna au projet Terra ($LUNA) qui est tombé à zéro, ces trois modèles n'ont aucun lien avec la blockchain ou les crypto-monnaies. Sol signifie lune en latin, Terra signifie terre et Luna signifie lune.

Ces trois modèles sont conçus pour différents besoins des entreprises :

  • Sol est l'option phare la plus avancée, conçue pour les tâches les plus exigeantes comme le raisonnement complexe, le codage étendu, les workflows avancés basés sur des agents et la défense en cybersécurité.
  • Terra équilibre performances puissantes et efficacité, adapté aux environnements de production nécessitant de traiter de gros volumes de travail (comme le support client, les outils internes et l'analyse de documents) tout en maîtrisant les coûts.
  • Luna est l'option la plus légère et la plus rentable de la famille, optimisée pour la vitesse et les tâches d'automatisation routinières quotidiennes.

Tarification GPT 5.6 Sol, Terra, Luna : différences de frais API

En termes de prix, GPT-5.6 est facturé par million de tokens en fonction des trois tailles de modèles. Le tableau détaillé des prix et du positionnement est présenté ci-dessous (version mobile : faites glisser le tableau horizontalement) :

| Modèle | Positionnement | Entrée par million de tokens | Sortie par million de tokens | | --- | --- | --- | --- | | GPT-5.6 Sol | Modèle phare, adapté au raisonnement avancé, aux agents, à la recherche en sécurité | 5 $ | 30 $ | | GPT-5.6 Terra | Modèle équilibré pour entreprises | 2,5 $ | 15 $ | | GPT-5.6 Luna | Modèle haute efficacité et faible coût | 1 $ | 6 $ |

Comparaison des prix API de GPT 5.6 avec Claude, Gemini, Grok, etc.

Outre la publication des prix de la série GPT-5.6, VentureBeat a également compilé les prix API des principaux modèles de langage (LLM) actuels.

Sur l'ensemble du marché, GPT-5.6 Luna se positionne dans la fourchette de prix moyenne-basse, avec un prix d'entrée de 1 $ par million de tokens et un prix de sortie de 6 $, soit un coût total d'environ 7 $, se situant entre GLM-5.2 et Grok 4.3 (Low Context).

Pour des capacités de raisonnement plus élevées, le coût total de GPT-5.6 Terra est d'environ 17,5 $, identique à GPT-5.4. Le modèle phare GPT-5.6 Sol maintient le même prix que GPT-5.5, avec une entrée de 5 $ par million de tokens et une sortie de 30 $, soit un coût total d'environ 35 $, inférieur aux 60 $ du dernier Claude Fable 5/Claude Mythos 5 d'Anthropic.

Comparaison des prix API des principaux modèles d'IA (par million de tokens), compilée par le média étranger "VentureBeat"

| Modèle | Input | Output | Coût total | | --- | --- | --- | --- | | MiMo-V2.5 Flash | 0,10 $ | 0,30 $ | 0,40 $ | | DeepSeek V4 Flash | 0,14 $ | 0,28 $ | 0,42 $ | | DeepSeek V4 Pro | 0,435 $ | 0,87 $ | 1,305 $ | | MiniMax M3 | 0,30 $ | 1,20 $ | 1,50 $ | | Gemini 3.1 Flash Lite | 0,25 $ | 1,50 $ | 1,75 $ | | Qwen3.7 Plus | 0,40 $ | 1,60 $ | 2,00 $ | | MiMo-V2.5 | 0,40 $ | 2,00 $ | 2,40 $ | | Grok 4.3 (Low Context) | 1,25 $ | 2,50 $ | 3,75 $ | | MiMo-V2.5 Pro (≤256K) | 1,00 $ | 3,00 $ | 4,00 $ | | Kimi-K2.6 | 0,95 $ | 4,00 $ | 4,95 $ | | GLM-5.2 | 1,40 $ | 4,40 $ | 5,80 $ | | GPT-5.6 Luna | 1,00 $ | 6,00 $ | 7,00 $ | | Grok 4.3 (High Context) | 2,50 $ | 5,00 $ | 7,50 $ | | MiMo-V2.5 Pro (>256K) | 2,00 $ | 6,00 $ | 8,00 $ | | Qwen3.7 Max | 2,50 $ | 7,50 $ | 10,00 $ | | Gemini 3.5 Flash | 1,50 $ | 9,00 $ | 10,50 $ | | Gemini 3.1 Pro Preview (≤200K) | 2,00 $ | 12,00 $ | 14,00 $ | | GPT-5.6 Terra | 2,50 $ | 15,00 $ | 17,50 $ | | GPT-5.4 | 2,50 $ | 15,00 $ | 17,50 $ | | Gemini 3.1 Pro Preview (>200K) | 4,00 $ | 18,00 $ | 22,00 $ | | Claude Opus 4.8 | 5,00 $ | 25,00 $ | 30,00 $ | | GPT-5.5 | 5,00 $ | 30,00 $ | 35,00 $ | | GPT-5.5 Instant | 5,00 $ | 30,00 $ | 35,00 $ | | Sakana Fugu Ultra | 5,00 $ | 30,00 $ | 35,00 $ | | GPT-5.6 Sol | 5,00 $ | 30,00 $ | 35,00 $ | | Claude Fable 5 / Claude Mythos 5 | 10,00 $ | 50,00 $ | 60,00 $ |

Avec cette nouvelle dénomination Sol, Terra, Luna, OpenAI permet aux entreprises de choisir plus facilement le modèle adapté en fonction des capacités, de la vitesse et du coût, plutôt que de se baser sur la taille du modèle.

Nouvelles technologies de GPT 5.6 : raisonnement approfondi et collaboration de sous-agents

Outre l'amélioration des capacités des modèles, GPT-5.6 introduit également un nouveau mode de raisonnement. Selon OpenAI, Sol ajoute un mode Max Reasoning qui permet au modèle de consacrer plus de temps au raisonnement, améliorant ainsi la qualité de l'exécution des tâches complexes.

Parallèlement, OpenAI lance le mode Ultra, qui permet à plusieurs sous-agents de collaborer pour traiter de grandes tâches, plutôt que de confier tout le travail à un seul agent, améliorant ainsi l'efficacité des grands projets et des processus longs.

Cette conception est principalement destinée aux workflows d'agents d'entreprise. En décomposant les tâches complexes en plusieurs sous-agents travaillant ensemble, elle améliore l'efficacité du raisonnement à long terme, du développement de code et de l'exécution de grands projets. C'est également l'une des principales différences entre GPT-5.6 et GPT-5.5.

Amélioration générale des benchmarks, TerminalBench atteint un record

Selon les résultats de test publiés par OpenAI, GPT-5.6 Sol a obtenu les meilleurs résultats à ce jour dans le test de workflow en ligne de commande TerminalBench 2.1, surpassant GPT-5.5 ainsi que des modèles concurrents comme Claude Mythos 5.

De plus, dans le test de recherche biologique GeneBench, GPT-5.6 Sol a obtenu de meilleurs résultats que GPT-5.5 tout en utilisant moins de tokens.

De multiples tests montrent que Sol surpasse GPT-5.5 dans des benchmarks comme Agent's Last Exam, TerminalBench et ExploitBench, tandis que Terra surpasse également le modèle phare précédent dans plusieurs tests de workflow. Luna, quant à elle, offre des performances proches de celles de GPT-5.5 tout en maintenant un faible coût.

Mise à jour du mécanisme Prompt Cache, Cerebras offrira jusqu'à 750 tokens par seconde

OpenAI a également mis à jour le mécanisme Prompt Cache, ajoutant un point d'arrêt de cache explicite et offrant un temps de conservation du cache d'au moins 30 minutes. Officiellement, l'écriture en cache sera facturée à 1,25 fois le prix d'entrée non mise en cache, tandis que la lecture en cache conserve une remise de 90 %, permettant aux entreprises de mieux contrôler les coûts de tokens des workflows d'agents.

D'autre part, OpenAI a annoncé que GPT-5.6 Sol sera disponible sur la plateforme Cerebras en juillet de cette année, avec une vitesse d'inférence pouvant atteindre 750 tokens par seconde, ciblant principalement les applications d'entreprise à grande échelle nécessitant une faible latence et des performances élevées.

Pour les workflows répétitifs à grand volume, le nouveau mécanisme de cache combiné à une inférence rapide pourrait réduire les coûts de calcul globaux.

Applications d'entreprise renforcées, mais sécurité accrue

OpenAI indique que la série GPT-5.6 utilise l'architecture de sécurité multicouche la plus complète à ce jour, incluant des mécanismes de rejet au niveau du modèle, des classificateurs en temps réel pour la biologie et la cybersécurité, une analyse des risques au niveau des comptes et des tests d'intrusion continus (red teaming), visant à répondre aux besoins de défense en cybersécurité tout en réduisant les utilisations malveillantes.

Officiellement, GPT-5.6 Sol est plus apte à aider à identifier et à corriger les vulnérabilités, mais n'a pas encore atteint le niveau Cyber Critical permettant d'exécuter de manière autonome une chaîne d'attaque complète.

OpenAI a consacré environ 700 000 heures de GPU A100 à des tests d'intrusion automatisés pour GPT-5.6, tout en ajoutant des mécanismes de détection des risques en temps réel, des classificateurs d'activation et une vérification de sécurité pendant le raisonnement. Cependant, comme la recherche en cybersécurité a une double utilité, OpenAI reconnaît que certains travaux légitimes peuvent encore être affectés par les contrôles de sécurité.

Le déploiement progressif de GPT 5.6 reflète une nouvelle orientation de la gouvernance de l'IA

Ce lancement limité de GPT-5.6 constitue un cas important de gouvernance de l'IA récente.

Selon OpenAI, avant le lancement officiel, l'entreprise a d'abord présenté au gouvernement américain les capacités du modèle et ses plans de déploiement, et a fourni un accès à un petit nombre de partenaires de confiance pour des tests, conformément aux exigences gouvernementales, avant d'élargir progressivement l'accès.

OpenAI espère que cette approche d'examen préalable par le gouvernement ne soit qu'une mesure transitoire et souhaite à l'avenir permettre aux développeurs, aux entreprises et au grand public d'accéder plus largement aux modèles les plus récents.

Selon un rapport de "Decrypt", ce lancement restreint est également lié au récent cadre d'évaluation des nouveaux modèles d'IA mis en place par le gouvernement américain. Après les restrictions imposées à Claude Mythos 5 et Claude Fable 5 d'Anthropic, GPT-5.6 devient le deuxième modèle d'IA de pointe récent à être affecté par les processus de lancement du gouvernement américain.

Au vu des récents événements chez les deux géants, il est possible que, à l'avenir, la vérification de sécurité gouvernementale, la gouvernance d'entreprise et l'évaluation des capacités des modèles fassent progressivement partie du processus de lancement des grands modèles d'IA.

  • **Article connexe : **Claude Fable 5 interdit et retiré ! Un conseiller de la Maison Blanche révèle les raisons de l'interdiction, Yann LeCun critique les conséquences néfastes
SOL2,44%
LUNA-1,37%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé