GPT-5.6 test secret en circulation : ChatGPT devient incroyablement intelligent, les tests utilisateurs surpassent Fable 5

ChatGPT Utilisateurs rapportent collectivement une amélioration spectaculaire de la qualité de sortie cette semaine, avec un allongement évident des temps de réponse, ce qui a suscité de vives spéculations sur un test secret par OpenAI du prochain modèle GPT-5.6. De la génération d’un jeu 3D en un clic à la simulation de robots, plusieurs développeurs ont publié des comparaisons en test sur la plateforme X, affirmant que « le 5.5 Pro a été discrètement remplacé par le 5.6 ». Il se murmure qu’une sortie officielle pourrait intervenir dès le 25 juin, mais OpenAI reste silencieux à ce jour.
(Précédent : Le co-responsable de Google Gemini, Noam Shazeer, quitte pour rejoindre OpenAI)
(Contexte supplémentaire : La nouvelle version Mythos d’Anthropic est terminée, Sonnet 5 sera publié cette semaine)

Table des matières

Toggle

  • Utilisateurs rapportent : réponse plus lente, qualité en hausse
  • Fuites de détails émergent : Juice Value augmentée, mise à jour de la date de coupure des connaissances
  • Silence d’OpenAI et antécédents de « lancement silencieux »
  • Derrière la course à la sortie d’un nouveau modèle : GLM-5.2 en poursuite, Anthropic soumis à des restrictions à l’export

Cette semaine, les utilisateurs de ChatGPT ont soudainement constaté une chose : la qualité des conversations semblait différente. Ce n’est pas une impression isolée, mais une multitude de retours de développeurs, créateurs, organismes d’évaluation, tous convergeant vers une même hypothèse : OpenAI pourrait tester en secret un nouveau modèle.

Le développeur Anshu Chimala a publié jeudi une vidéo comparative sur X, montrant la différence de qualité d’une page d’accueil générée en un clic, déclarant : « Well well well, je suis l’heureux chanceux qui a pu tester en avant-première GPT-5.6 Pro. » Un autre développeur, Dobroslav Radosavljevič, a posté sur X qu’il trouvait que le modèle utilisé dans Codex « ne ressemblait en rien à 5.5 », et la discussion dans la section commentaires est divisée entre ceux qui y croient dur comme fer et ceux qui restent sceptiques.

Utilisateurs rapportent collectivement : réponse plus lente, qualité en hausse

Le trait commun le plus évident est le temps. Le développeur Conor Dart a effectué un test : générer un jeu 3D avec moteur physique et contrôle de caméra à partir d’un seul prompt, ce qui a pris plus d’une heure, alors que GPT-5.5 Pro prend habituellement environ 10 minutes. Il écrit : « Ce n’est pas parfait, mais réaliser cela avec un seul prompt est vraiment impressionnant. »

Chetas Lua, une figure de la communauté AI, a également rapporté une situation similaire sur X : lors de tests avec un robot simulé, le temps de réponse a été étendu à 20-40 minutes, qualifiant ce rythme de « jamais vu depuis le lancement de GPT-5.5 ». Il ajoute : « GPT-5.6 Pro continue de surpasser Fable 5 d’Anthropic en 3D. »

Cependant, tous les tests ne sont pas unanimes. Le testeur de benchmarks AI, Chris, a utilisé le même prompt de construction de vaisseau spatial pour tester deux modèles : le supposé GPT-5.6 Pro a tourné 87 minutes, tandis que GPT-5.5 Extra High n’a nécessité que 34 minutes et 42 secondes. Il analyse : « Comme je l’ai dit avant, GPT-5.6 est une mise à niveau progressive et robuste par rapport à 5.5, pas un tueur de Fable. Il pourrait rivaliser avec Fable 5 sur certains benchmarks, mais ne surpassera pas nettement dans l’ensemble. »

Fuites de détails émergent : Juice Value augmentée, mise à jour de la date de coupure des connaissances

Avec l’intensification des discussions, davantage d’informations fuitent. Le leakster Pankaj Kumar a détaillé plusieurs changements de spécifications : la date de coupure des connaissances repoussée à décembre 2025 ; la « Juice Value », un paramètre de puissance de raisonnement, qui aurait été porté de 768 à 960 ; la capacité de génération SVG et de conception 3D surpassant Fable 5 sur certains tests. Bien que ces informations ne soient pas confirmées par OpenAI, elles sont cohérentes entre plusieurs comptes : capacités de raisonnement accrues, interface front-end incomplète, et un code de projet nommé « Kindle-Alpha ».

Leo, une figure influente dans le domaine AI, a publié un message anonyme indiquant que GPT-5.6 « est actuellement testé en secret sur certains comptes Pro, lorsque l’utilisateur sélectionne GPT-5.5 Pro, c’est en réalité le 5.6 qui tourne », et prévoit une sortie publique le 25 juin (jeudi).

Silence d’OpenAI et antécédents de « lancement silencieux »

Ce n’est pas la première fois qu’OpenAI opte pour une stratégie de « mise en ligne sans annonce ». Lors du lancement de GPT-4.5, OpenAI a également remplacé le modèle sans préavis, jusqu’à ce que les utilisateurs découvrent la différence, puis confirment discrètement. Cette stratégie de lancement furtif permet à la fois de collecter des données réelles d’utilisation sans attirer l’attention, et de faire un rollback discret en cas de problème, évitant ainsi une crise de relations publiques.

Contrairement à Anthropic, qui fait souvent beaucoup de bruit lors du lancement de chaque modèle, Fable 5 et Mythos 5 ont tous deux des calendriers précis depuis la fin de leur entraînement jusqu’à leur mise en ligne. OpenAI tend de plus en plus à faire « d’abord, puis parler » lors de ses itérations. Selon une source, le scientifique en chef Jakub Pachocki aurait déclaré lors d’une réunion interne que le nouveau modèle est une amélioration significative de GPT-5.5, mais The Information indique que cela reste non confirmé, sans mention d’A/B testing ou de calendrier précis.

Il est à noter que Decrypt a posé la question à OpenAI, sans obtenir de réponse à ce jour.

Derrière la course à la sortie d’un nouveau modèle : GLM-5.2 en poursuite, Anthropic soumis à des restrictions à l’export

Si OpenAI accélère effectivement le lancement de sa nouvelle génération de modèles phares, cela s’explique par une forte pression concurrentielle. Le modèle open source chinois GLM-5.2, sur le benchmark FrontierSWE, ne se laisse distancer que d’un point par Claude Opus 4.8, et dépasse directement GPT-5.5. Ce score, qui mesure la performance des agents IA sur des tâches complexes de plusieurs heures, devient un nouveau standard pour évaluer la capacité réelle des modèles.

De leur côté, Anthropic se trouve dans une situation délicate. Leur modèle phare Mythos 5 et Fable 5 ont été retirés suite à une directive d’exportation du gouvernement américain datée du 12 juin, en raison d’une vulnérabilité de jailbreak controversée. Cela crée un vide dans le marché des modèles haut de gamme, et donne à OpenAI une opportunité précieuse : si elle peut lancer GPT-5.6 avant qu’Anthropic ne résolve ses restrictions à l’export, elle pourrait combler ce vide.

Par ailleurs, le Wall Street Journal rapporte qu’OpenAI envisage de réduire les prix pour les développeurs et entreprises, en préparation d’un double IPO imminent. La compétition s’intensifie, une guerre des prix pourrait éclater, et le lancement du nouveau modèle est crucial pour la narration financière d’OpenAI.

Quoi qu’en pensent la communauté et les spéculations, seul OpenAI peut confirmer l’existence de GPT-5.6. Mais les traders du marché des prédictions Polymarket, eux, ne veulent pas attendre : à la fin de la semaine, le prix du contrat indiquant une sortie entre le 22 et le 28 juin a déjà grimpé à 89 %.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé