GPT 5.6 Sol、Terra、Luna まとめ:特徴、価格を一度に見る、Claudeと比較してどちらが強い?

OpenAIがGPT-5.6シリーズモデルを発表。本記事ではSol、Terra、Lunaモデルファミリーの特徴、料金、API費用を一覧で紹介。ただし、トランプ政権のセキュリティ審査要件に対応するため、現時点では特定のパートナーに限定した限定プレビューのみ。

GPT 5.6電撃発表、トランプ政権の要求によりアクセス制限

OpenAIは6月26日、次世代GPT-5.6モデルシリーズをサプライズ発表。フラッグシップモデルのSol、バランス型モデルのTerra、ハイCP値モデルのLunaを包含する。

しかし、トランプ政権による先端AIモデルへのセキュリティ審査要件の影響で、**OpenAIは現時点では少数の信頼できるパートナーに限定した限定プレビュー版のみを提供し、ChatGPTでは一時的に利用不可。今後段階的に開放予定。**それでも、GPT-5.6、OpenAIプレビュー版、Sol、Terra、Lunaの突如のリリースは、テクノロジー業界のホットな検索キーワードとなっている。

GPT 5.6三大モデルの違い:Sol、Terra、Luna

GPT-5.6シリーズは命名システムを大幅に修正。従来よく見られたnanoやminiなどの名称を廃止。OpenAIは、新しい命名システムにおいて数字はモデルの世代を表し、Sol、Terra、Lunaはそれぞれ独立して発展した永続的な能力レベルを示すと説明。企業や開発者が知能性能、速度、コストの間でより明確な選択を行えるようにするためだ。

暗号資産投資家にとって、Solはレイヤー1ブロックチェーンのSolana($SOL)を連想させやすく、TerraとLunaは同名の崩壊プロジェクトTerra($LUNA)を思い起こさせるが、これら三大モデルはブロックチェーンや暗号通貨とは全く関係ない。Solはラテン語で「月」、Terraは「地球」、Lunaは「月」を意味する。

これら3つのモデルは、さまざまな企業ニーズに合わせて設計:

  • Solは最上位のフラッグシップオプションで、複雑な推論、延長コーディング、高度なエージェント駆動ワークフロー、サイバーセキュリティ防御など、最も困難なタスク向けに構築
  • Terraは強力な性能と効率のバランスを実現し、コストを管理しながら大量の処理(カスタマーサポート、内部ツール、文書分析など)が必要な本番環境に適している
  • Lunaはファミリー中最も軽量でコスト効果の高い選択肢であり、速度と日常的なルーティン自動化タスクを最適化

GPT 5.6 Sol、Terra、Lunaの料金:API費用の違い

価格面では、GPT-5.6は3つのモデルサイズに応じて100万トークンあたりの価格を設定。詳細な料金とポジショニングは以下の表の通り(モバイル版は表を左右にスクロール可能):

| モデル | ポジショニング | 100万トークンあたり入力 | 100万トークンあたり出力 | | --- | --- | --- | --- | | GPT-5.6 Sol | フラッグシップモデル。高度な推論、エージェント、セキュリティ研究に最適 | 5 米ドル | 30 米ドル | | GPT-5.6 Terra | バランス型エンタープライズモデル | 2.5 米ドル | 15 米ドル | | GPT-5.6 Luna | 高効率・低コストモデル | 1 米ドル | 6 米ドル |

GPT 5.6とClaude、Gemini、GrokなどのAPI価格比較

GPT-5.6シリーズの価格発表に加え、VentureBeatが現在の主流大規模言語モデル(LLM)のAPI価格をまとめた。

市場全体で見ると、GPT-5.6 Lunaは中低価格帯に位置し、100万トークンあたりの入力価格は1米ドル、出力価格は6米ドル、総コストは約7米ドルで、GLM-5.2とGrok 4.3(Low Context)の中間に位置する。

より高い推論能力が必要な場合、GPT-5.6 Terraの総コストは約17.5米ドルで、GPT-5.4と同水準。フラッグシップモデルのGPT-5.6 SolはGPT-5.5と同じ価格設定で、100万トークンあたり入力5米ドル、出力30米ドル、総コスト約35米ドル。これはAnthropicの最新Claude Fable 5/Claude Mythos 5の60米ドルを下回る。

主流AIモデルAPI価格比較(100万トークンあたり)、海外メディア《VentureBeat》まとめ

| モデル | Input | Output | 総コスト | | --- | --- | --- | --- | | MiMo-V2.5 Flash | 0.10 米ドル | 0.30 米ドル | 0.40 米ドル | | DeepSeek V4 Flash | 0.14 米ドル | 0.28 米ドル | 0.42 米ドル | | DeepSeek V4 Pro | 0.435 米ドル | 0.87 米ドル | 1.305 米ドル | | MiniMax M3 | 0.30 米ドル | 1.20 米ドル | 1.50 米ドル | | Gemini 3.1 Flash Lite | 0.25 米ドル | 1.50 米ドル | 1.75 米ドル | | Qwen3.7 Plus | 0.40 米ドル | 1.60 米ドル | 2.00 米ドル | | MiMo-V2.5 | 0.40 米ドル | 2.00 米ドル | 2.40 米ドル | | Grok 4.3(Low Context) | 1.25 米ドル | 2.50 米ドル | 3.75 米ドル | | MiMo-V2.5 Pro(≤256K) | 1.00 米ドル | 3.00 米ドル | 4.00 米ドル | | Kimi-K2.6 | 0.95 米ドル | 4.00 米ドル | 4.95 米ドル | | GLM-5.2 | 1.40 米ドル | 4.40 米ドル | 5.80 米ドル | | GPT-5.6 Luna | 1.00 米ドル | 6.00 米ドル | 7.00 米ドル | | Grok 4.3(High Context) | 2.50 米ドル | 5.00 米ドル | 7.50 米ドル | | MiMo-V2.5 Pro(>256K) | 2.00 米ドル | 6.00 米ドル | 8.00 米ドル | | Qwen3.7 Max | 2.50 米ドル | 7.50 米ドル | 10.00 米ドル | | Gemini 3.5 Flash | 1.50 米ドル | 9.00 米ドル | 10.50 米ドル | | Gemini 3.1 Pro Preview(≤200K) | 2.00 米ドル | 12.00 米ドル | 14.00 米ドル | | GPT-5.6 Terra | 2.50 米ドル | 15.00 米ドル | 17.50 米ドル | | GPT-5.4 | 2.50 米ドル | 15.00 米ドル | 17.50 米ドル | | Gemini 3.1 Pro Preview(>200K) | 4.00 米ドル | 18.00 米ドル | 22.00 米ドル | | Claude Opus 4.8 | 5.00 米ドル | 25.00 米ドル | 30.00 米ドル | | GPT-5.5 | 5.00 米ドル | 30.00 米ドル | 35.00 米ドル | | GPT-5.5 Instant | 5.00 米ドル | 30.00 米ドル | 35.00 米ドル | | Sakana Fugu Ultra | 5.00 米ドル | 30.00 米ドル | 35.00 米ドル | | GPT-5.6 Sol | 5.00 米ドル | 30.00 米ドル | 35.00 米ドル | | Claude Fable 5/Claude Mythos 5 | 10.00 米ドル | 50.00 米ドル | 60.00 米ドル |

OpenAIが今回Sol、Terra、Lunaの命名を採用したことで、企業はモデルサイズではなく、能力、速度、コストに基づいて適切なモデルを選択しやすくなった。

GPT 5.6の新技術:より深い推論とサブエージェントの協調

モデル能力の向上に加え、GPT-5.6は新しい推論モードも導入。OpenAIの発表によると、SolにはMax Reasoningモードが追加され、モデルがより多くの推論時間を費やし、複雑なタスクの完成品質を向上させる。

同時に、OpenAIはUltraモードも発表。単一のエージェントがすべての作業を完了するのではなく、複数のサブエージェント(Subagent)が協調して大規模タスクを処理することで、大規模プロジェクトや長いワークフローの効率を向上させる。

この設計は主にエンタープライズエージェントワークフロー向けに作られており、複雑な作業を複数のサブエージェントに分割して共同処理することで、長時間の推論、プログラム開発、大規模プロジェクトの実行効率を改善。これはGPT-5.5との重要な違いの一つでもある。

ベンチマークが全体的に向上、TerminalBenchで過去最高を記録

OpenAIが発表したテスト結果によると、GPT-5.6 SolはTerminalBench 2.1のコマンドラインワークフローテストで過去最高のスコアを記録。GPT-5.5を上回り、Claude Mythos 5などの競合モデルよりも高い。

さらに、GeneBench生物学研究テストでは、GPT-5.6 Solはより少ないトークンを使用しながら、GPT-5.5よりも良い結果を達成。

複数のテストから、SolはAgent's Last Exam、TerminalBench、ExploitBenchなどのベンチマークでGPT-5.5を上回っており、Terraは多くのワークフローテストで前世代のフラッグシップモデルを超えている。Lunaは低コストを維持しつつ、GPT-5.5に近い能力を示している。

Prompt Cacheメカニズムの更新、Cerebrasは最大750トークン/秒を提供

OpenAIは同時にPrompt Cacheメカニズムを更新。明確なCache Breakpointを追加し、少なくとも30分間のキャッシュ保存時間を提供。公式によると、キャッシュ書き込みはキャッシュなし入力価格の1.25倍で課金され、キャッシュ読み取りは90%割引を維持。これにより、企業はエージェントワークフローのトークンコストをより簡単に管理できる。

一方、OpenAIはGPT-5.6 Solが今年7月にCerebrasプラットフォームに搭載されることも発表。最大で毎秒750トークンの推論速度を達成し、主に低レイテンシー・高性能を必要とする大規模エンタープライズアプリケーションをターゲットとする。

大量の反復作業ワークフローにとって、新しいキャッシュメカニズムと高速推論の組み合わせは、全体的な計算コストの削減が期待される。

エンタープライズアプリケーションはさらに強力に、しかしセキュリティ保護も同時に強化

OpenAIは、GPT-5.6シリーズが現時点で最も完全な多層セキュリティ保護アーキテクチャを採用していると発表。モデルレベルの拒否メカニズム、リアルタイムの生物・サイバーセキュリティ分類器、アカウントレベルのリスク分析、継続的なレッドチームテストなどの対策を含み、セキュリティ防御要件を満たしつつ、悪意ある使用を低減することを目指す。

公式によると、GPT-5.6 Solは脆弱性の発見と修正に優れているが、完全な攻撃チェーンを自律的に完了できるCyber Criticalレベルにはまだ達していない。

OpenAIはGPT-5.6のために約70万A100 GPU時間を投資し、自動化レッドチームテストを実施。同時にリアルタイムリスク検出、Activation Classifier、推論中のセキュリティレビューなどのメカニズムを追加。ただし、セキュリティ研究には二重用途(デュアルユース)の性質があるため、OpenAIは正当な作業の一部がセキュリティチェックの影響を受ける可能性もあると認めている。

GPT 5.6の段階的リリースはAIガバナンスの新たな方向性を反映

今回のGPT-5.6の限定プレビューは、最近のAIガバナンスにおける重要な事例となった。

OpenAIの説明によると、同社は正式リリース前に米国政府にモデル能力とリリース計画を説明し、政府の要求に従ってまず少数の信頼できるパートナーにテストを提供し、その後段階的に開放を拡大した。

OpenAIは、このような政府先行審査のアプローチは過渡的な措置であり、将来は開発者、企業、一般ユーザーが最新モデルに広くアクセスできるようになることを期待していると述べている。

《Decrypt》の報道によると、今回のリリース制限は、米国政府が最近構築した次世代AIモデル評価フレームワークとも関係している。AnthropicのClaude Mythos 5とClaude Fable 5が制限を受けた後、GPT-5.6は米国政府のリリースプロセスの影響を受けた2つ目のフロンティアAIモデルとなった。

最近の2大企業の状況を見ると、今後大規模AIモデルが上市される際、政府のセキュリティ審査、企業ガバナンス、モデル能力評価が徐々にリリースプロセスの一部となる可能性が高い。

  • **関連報道:**Claude Fable 5が禁止・削除!ホワイトハウス顧問が禁止の内幕を暴露、ヤン・ルクンは自業自得と批判
SOL2.40%
LUNA-1.37%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め