今回のアップグレードの最も直感的な証拠は、一連のハードコアな評価結果に表れています。Humanity’s Last Exam(ツールなしの最終試験)で48.4%、ARC-AGI-2でARC賞基金会による検証済みの84.6%、Codeforcesの競技プログラミング基準でEloスコア3455を獲得しました。これらの成績は、「学術レベルの推論、抽象的な帰納、工学的アルゴリズムの実装」の三つの能力曲線の同時向上を示しています。
Gemini 3 Deep Thinkモードは、2025年11月にGemini 3 AIアプリケーション製品の一部として正式にリリースされました。
「人類最後の試験」成績が天井を更新
更新されたDeep Thinkは、いくつかの学術基準テストでより良いパフォーマンスを示しています。特に、Humanity’s Last Exam(HLE、人類の最後の試験)では、48.4%の新記録を樹立しました。この基準は、現代の最先端モデルの能力の限界を試すためのもので、Deep Thinkのこの驚異的な成績は、これまで公開されたすべてのAI大型モデルのスコアを大きく上回り、公式には「新たな業界標準」を設定したとされています。このことは、特定の推論テストにおいて、従来のモデルや競合他社を凌駕したことを意味し、分野のリーダーシップを示しています。
このアップデートされたGemini 3 Deep Thinkは、単なる「モデルの強化」だけでなく、「高強度推論」を明確に製品化し、答えやコード作成から、超大規模な研究・工学のワークフローへと展開しています。グーグルは公式発表で、これを科学、研究、工学の課題に向けた「専用推論モード」と定義し、Humanity’s Last Exam(48.4%、ツールなし)やARC-AGI-2(84.6%)の驚異的な成績を強調しています。この「ハード指標+具体的な応用シナリオ」の組み合わせは、話題性や開発者・機関の関心を集めやすいと考えられます。
今回のAI大規模モデルのアップグレードは、GeminiアプリシリーズのGoogle AI Ultraサブスクリプションユーザー向けに提供されるだけでなく、初めてGemini APIを通じて研究者やエンジニア、企業に早期アクセスを可能にしました(一部報道ではVertex AIの早期計画とも連動していると伝えられています)。これにより、企業の研究開発の連携(データ分析、シミュレーション、コードによる物理システムのモデル化、自動化実験・設計の反復など)に容易に組み込めるようになり、スケッチから3Dプリント可能なファイルへの変換といったデモンストレーション能力も相まって、爆発的な普及と話題化が期待されます。
「Gemini熱潮」が再び世界を席巻!Google ( GOOGL.US ) Deep Thinkの「ハードコアアップグレード」が大型研究プロジェクトに直撃
アメリカのテクノロジー大手グーグル(GOGL.US)は、世界中で人気のあるGemini 3 AI大規模モデルのDeep Think(深度思考)モードを科学、プログラミング、研究・工学などの分野で大幅にアップグレードしました。この最新のアップグレードは、現代の科学研究や工学分野のさまざまな複雑な課題解決に焦点を当てており、新たな「Gemini AI熱潮」を巻き起こすことが期待されています。グーグル公式は声明で、新しいDeep ThinkモードがGemini 3シリーズのAIアプリケーション製品において、Google AI Ultraのサブスクリプションユーザーに向けて提供開始されたと述べています。同社はまた、これはGemini APIを通じて一部の研究者、エンジニア、大企業にDeep Think機能を提供した初めての事例であるとも付け加えています。
グーグルによると、更新されたGemini 3 AI大規模モデルのDeep Think(深度思考)モードにより、サブスクリプションユーザーはスケッチから3Dプリント可能な実物を作り出すことができるようになりました。Deep Thinkは、図面の解析、非常に複雑な形状のモデリング、そして3Dプリント用のファイル生成といった強力な能力を持っています。
同社は木曜日のブログ記事で次のように述べています。「最先端の性能に加え、Deep Thinkは実用化を促進し、研究者が複雑なデータを深く解読できるようにし、エンジニアがコードやプログラミングを通じて複雑な物理システムをモデル化できるようにすることを目的としています。最も重要なのは、私たちがDeep Thinkを研究者や実務者が最も必要とする場所に導入しようとしていることです—Gemini APIなどのインターフェースから始めています」と述べています。
グーグルは、Gemini 3のDeep Think(深度思考)を「抽象的な高強度推論」からさらに進化させ、「実際の研究や工学のプロセスに落とし込める専門的な推論エンジン」へと推し進めています。特に、境界が曖昧でデータが不完全、目標関数が複雑なシナリオにおいて、研究者やエンジニアがより早く検証可能な結論や実行可能な解決策に近づくのを支援します。
今回のアップグレードの最も直感的な証拠は、一連のハードコアな評価結果に表れています。Humanity’s Last Exam(ツールなしの最終試験)で48.4%、ARC-AGI-2でARC賞基金会による検証済みの84.6%、Codeforcesの競技プログラミング基準でEloスコア3455を獲得しました。これらの成績は、「学術レベルの推論、抽象的な帰納、工学的アルゴリズムの実装」の三つの能力曲線の同時向上を示しています。
さらに重要なのは、Deep Thinkの強みが数学やプログラミングにとどまらなくなったことです。グーグルは、2025年の国際物理オリンピックや化学オリンピックの筆記試験で「金牌レベル」に達し、より学術的なCMT-Benchmark(凝縮状態理論)でも50.5%のスコアを獲得したと明らかにしています。能力の範囲を見ると、これは「物理的直感 + 化学的構造推論 + 数学的形式化 + コード化による解決策」の組み合わせを備え、単一の問題タイプだけでなく学際的な研究課題に対応できるようになったことを意味します。
Gemini 3 Deep Thinkモードは、2025年11月にGemini 3 AIアプリケーション製品の一部として正式にリリースされました。
「人類最後の試験」成績が天井を更新
更新されたDeep Thinkは、いくつかの学術基準テストでより良いパフォーマンスを示しています。特に、Humanity’s Last Exam(HLE、人類の最後の試験)では、48.4%の新記録を樹立しました。この基準は、現代の最先端モデルの能力の限界を試すためのもので、Deep Thinkのこの驚異的な成績は、これまで公開されたすべてのAI大型モデルのスコアを大きく上回り、公式には「新たな業界標準」を設定したとされています。このことは、特定の推論テストにおいて、従来のモデルや競合他社を凌駕したことを意味し、分野のリーダーシップを示しています。
グーグル公式は、同モデルがARC-AGI-2(推論タスクの基準テスト)で前例のない84.6%を達成し、ARC賞基金会による検証を受けたこと、またCodeforces(競技プログラミングプラットフォーム)でEloスコア3455を獲得したことを指摘しています。同社は、昨年このモデルが数学とプログラミングの世界選手権で金牌レベルに達したと述べています。
また、同モデルは高難度の数学や競技プログラミングだけでなく、化学や物理などのより広範な科学分野でも優れたパフォーマンスを示しています。
同社は、2025年の国際物理オリンピックや化学オリンピックの筆記試験でも、最強の金牌レベルの結果を出したと述べています。さらに、高度な理論物理の分野でも驚異的な熟練度を示し、CMT-Benchmarkで50.5%のスコアを獲得しています。
グーグルのGeminiは、OpenAIのChatGPTやAnthropicのClaudeなど、多くのAI製品と競合しています。
更新されたDeep Thinkは、世界的な「Gemini熱潮」の火付け役となる存在です。
このアップデートされたGemini 3 Deep Thinkは、単なる「モデルの強化」だけでなく、「高強度推論」を明確に製品化し、答えやコード作成から、超大規模な研究・工学のワークフローへと展開しています。グーグルは公式発表で、これを科学、研究、工学の課題に向けた「専用推論モード」と定義し、Humanity’s Last Exam(48.4%、ツールなし)やARC-AGI-2(84.6%)の驚異的な成績を強調しています。この「ハード指標+具体的な応用シナリオ」の組み合わせは、話題性や開発者・機関の関心を集めやすいと考えられます。
技術的な観点から見ると、Deep Thinkの核心は「より多くの知識を記憶すること」ではなく、「推論の構造化と拡張可能な推論能力」にあります。複数の仮説空間を並行探索し、「生成—検証—修正」の閉ループを通じて収束させる反復推論を行います。グーグルのDeepMindは、Deep Thinkを駆動する研究型エージェント(内部コード名Aletheia)もほぼ同時に公開し、自然言語検証器を用いて論理的な抜け穴を検出し、リライトや再推論を促す仕組みを導入しています。こうした「強い検証・強いフィードバックループ」の仕組みは、AI大規模モデルを「会話できるだけ」から「研究や工学に使える」段階へと進化させる重要な道筋です。
今回のAI大規模モデルのアップグレードは、GeminiアプリシリーズのGoogle AI Ultraサブスクリプションユーザー向けに提供されるだけでなく、初めてGemini APIを通じて研究者やエンジニア、企業に早期アクセスを可能にしました(一部報道ではVertex AIの早期計画とも連動していると伝えられています)。これにより、企業の研究開発の連携(データ分析、シミュレーション、コードによる物理システムのモデル化、自動化実験・設計の反復など)に容易に組み込めるようになり、スケッチから3Dプリント可能なファイルへの変換といったデモンストレーション能力も相まって、爆発的な普及と話題化が期待されます。