火事場泥棒?GPT-5.6の3大モデルが全公開 7月7日に決定

作者:ASI启示录;来源:新智元

GPT-5.6、来週リリース?

昨日、ネットユーザーは興奮して発見した:Codexアプリの基盤コードにGPT-5.6 Sol、Terra、Lunaの3つのサブモデル識別子が登場していた。

さらに期待を集めるのは、コード内に新しい「スピードダイヤル」機能も現れたことだ。

これは、ユーザーがニーズに応じて速度と品質を自由に調整できることを示唆しており、これまでにないコントロール体験をもたらすことは間違いない。

リーク情報によれば、OpenAIは社内で厳命を下している:GPT-5.6のリリース目標ウィンドウは来週火曜日(7月7日)から7月9日までだ。

なぜ7月7日なのか?この日は、ちょうどClaude Fable 5の特定制限プランが失効する空白期間に当たるからだ。

これは時間単位で計算されたビジネス包囲網だ。

最近、Anthropicは一連の不手際で多くの開発者を怒らせ、Google Gemini 3.5 Proは緊急に再調整を余儀なくされている。OpenAIはこのタイミングを狙って、打撃を与えに行こうとしている。

Codexコードを解析 Sol、Terra、Luna、すべてが来る

「正直なところ、OpenAIは何事もなかったかのように、モデル名をデッドコードにこっそり埋め込んでいる。まるで我々が気づかないと思っているかのようだ。」あるネットユーザーはこう冗談を言った。

GPT-5.6の限定リリース以来、ギークたちはOpenAIのフロントエンドの更新をじっと見守っている。

そしてつい最近、Codexアプリのマージで、誰かがGPT-5.6の痕跡を発見した。

ネットユーザーがショート動画を公開しており、現時点ではバックエンドのインターフェース制限によりモデル呼び出しは成功しないものの、フロントエンドのポップアップウィンドウには、3つのモデルのスタイルと新しい「速度セレクター」がはっきりと表示されている。

さらに、コードには「Sol Ultra」という文字もかすかに現れている。業界では、Sol Ultraは競合のトップフラッグシップに直接対抗する切り札であり、性能ではFable 5に匹敵するが、価格ははるかに手頃になると推測されている。

この3つのモデルに加えて、コードからはもう一つの重要な情報が明らかになった:待望の「リアルタイム音声サポート」は現在まだ開発段階にあり、来週の直接リリースはほぼ不可能だ。

リーク実測流出:GPT-5.6 vs Fable 5

大多数の人がまだ使えていないが、内部テスト権限を獲得した一部のプレイヤーは、実際のエンジニアリング環境でのGPT-5.6の比較評価をすでに共有している。

結果はただ一言——次元の違う打撃。

ラウンド1:効率と理解の限界攻防

海外の技術ブロガーShivamは、GPT-5.6-terraとFable 5を使って同じ複雑な技術プロンプトを解決した体験を共有した。

Fable-5は100%の5時間セッション制限からスタート。このモデルはバックグラウンドで狂ったように「思考」し、なんと21%の制限を消費し、最終的な応答は、交差する質問の山を返し、解決すべき技術的詳細を再確認させるものだった。

同じタスクで、GPT-5.6-terraはわずか13%の制限を消費し、応答速度は驚くほど速かった。

無駄な言葉はなく、問題を解決するためのいくつかの異なる方法とアーキテクチャパスを直接効率的にリストアップし、すぐに実行を開始した。

Shivamは直言する:Fableを使っているときは、いつOpus 4.8にダウングレードされるか心配で頭がいっぱいだった。一方、GPT-5.6-terraの潔さは非常に快適だった。

ラウンド2:WebGLフロントエンドのハードコアミニゲーム「ブラインドテスト」

OracleのディレクターGilson Meloは、GPT-5.6 HighとFable 5 Highにハードな課題を出した:

単一のHTMLファイルで、ゼロから機能的なブラウザベースのゲーム(WebGLまたはHTML5 Canvasを使用)を構築せよ。ゲームはリアルタイム剛体物理、重力、ユーザー制御のパドル/宇宙船メカニズムを持たなければならない。完全なCSS、JS、HTMLを記述し、いかなるロジックも省略してはならない。マウスドラッグによるリアルタイム物理フィードバックをサポートしなければならない。

この問題は、モデルの極限の詳細処理、長いコードの省略なし、および基礎的な物理公式の計算能力を厳しく試すものだ。

2つのモデルはワークフローで異なる戦略を示した。

Fable 5 Highのパフォーマンスは驚くべきもので、非常に自信を持ってワンクリックで最後まで進み、ゲームの全コードを生成した。

一方、GPT-5.6 Highは生成プロセス中に非常に人間らしく2回一時停止し、自ら開発者に2つの最終的な重要な決定を尋ね、明確にした。

さらに驚くべきは、要求されていないにもかかわらず、勝手にゲームに効果音を追加したことだ。

最終結果では、GPT-5.6 Highが全体的なゲーム体験、物理衝突の滑らかさ、そして細部の堅牢性で、より堅実なスコアを獲得した。

要するに、両テスターとも、GPT-5.6は効率と応答スタイルで優れており、特に複雑なタスクを処理する際の明確さと速度で優れていると考えている。

この結果から、来週のGPT-5.6のリリースを大いに期待する価値がある。

正確なタイミング OpenAIが火事場泥棒でユーザーを奪う

モデルリークが偶然だとすれば、リリース時期は間違いなく深く考慮された布石である。

OpenAIは7月7日にGPT-5.6を大々的にリリースする計画であり、ちょうどClaudeユーザーがFable 5へのアクセス権を失う日に合わせている。

最近Claudeは多くのユーザーを失っており、OpenAIは機会を狙い、すべてを受け入れようとしている。

ある内部関係者は次のように語る:「GPT-5.6の使用制限は大幅に緩和され、Fable 5よりも寛大になる。より厳格なセーフティガードも段階的に導入されているが、Fableのように通常の使用に影響を与えるほど過激ではない。」

ユーザーの不満が高まり、OpenAIのユーザー獲得に絶好のタイミング

対照的に、Anthropicは最近、民衆の不満が大きい。

Claude Fable 5は復帰したばかりだが、すでにユーザーの強い不満を引き起こしている。

少し質問をするだけで、Fable 5はOpus 4.8にダウングレードされる。

生物医学エンジニアのDerya Unutmazは、Fable 5に「human」という言葉を説明させようとした。

「Explain human」と打ち込んだだけで、モデルは数秒考えた後、「Switched to Opus 4.8」のカードを表示した。Fable 5のセキュリティメカニズムが、このメッセージに遮断すべき内容があると判断したためだ。

さらに滑稽なのは、半導体アナリストのDylan Patelが非常に簡単な質問をしたことだ:「raspberryという単語には何文字のrがある?」

この質問も遮断され、インターフェースに「Chat paused」と表示された。Fable 5のセキュリティメカニズムが、ほとんどのサイバーセキュリティや生物学のトピックを遮断することを示している。

さらに、Opus 4.8の最近の幻覚問題は非常に深刻で、自分の会話に他人の情報が現れることさえある。

このようなユーザー体験の断崖的な低下は、まさにOpenAIにとって最高のユーザー獲得の窓口を生み出している。

そして、GPT-5.6はコスト面でも優位性を持つ可能性が高い。

リークによれば、GPT-5.6 SolはFable 5の2倍以上安くなる。なぜなら、そのトークン効率が高いからだ。しかし、肝心なのは、その性能がFable 5に匹敵するかどうかだ。

誰かが予測する:Sol UltraはFable 5に匹敵し、同時にFable 5よりも安価である可能性が高い。この予測が実現すれば、OpenAIはコストパフォーマンスで完全にライバルを打ち負かすだろう。

開発者に4回のCodexリセット枠を注意喚起、無駄にするな

最後に、Codexに戻ろうとしているすべてのハードコア開発者に「お得情報/落とし穴回避」ガイドをお知らせする。

Reflection CTOの深掘り調査によると、以前Codexで4回のレート制限リセット枠を貯めた場合、すぐにアカウントのバックエンドを確認することを勧める。

OpenAIの公式基盤ルールによれば、これらのリセット枠の有効期間はわずか30日である。最初の枠が6月11日か12日頃に入金された場合、7月12日頃から一括で失効し始める!

正確な有効期限を知りたい場合は、CodexにChatGPTトークンを呼び出させて、このバックエンドAPIをリクエストさせることができる: GET

以下のようなJSON応答が返ってくる:

もしGPT-5.6が本当に来週の火曜日に予定通り解放されるなら、手元の最初のリセット枠を消費するための時間はわずか4〜5日しかない。

来週の火曜日、OpenAIはおそらく全員にもう一度新しいリセットを提供するだろう。だから、ここ数日のうちに手元の古い枠を有効活用しよう。

GPT-5.6、来週会おう!

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め