マイクロソフト Build 2026 開発者会議:「エージェント優先」時代の到来、7つの自社開発モデルを一気に発表

文丨李海伦

編集丨徐青陽

アメリカ現地時間6月2日、Microsoft Build 2026 開発者会議がサンフランシスコのメイソンバーグで幕を開けた。今回の大会テーマは最先端AI技術の実戦応用に焦点を当てており、Microsoftは自社開発のAIモデル、エージェントアプリケーション、OSのセキュリティ、開発者ツール、クラウドサービス、新型ハードウェアプラットフォームを網羅した製品とアップデートを発表した。

2025年の開発者会議では、「AIエージェント時代」への方向性を確立し、Copilot Studioの多エージェント編成、Windows AI Foundryを発表、Model Context Protocolの全面サポートを表明、GitHub CopilotはプログラミングエージェントCoding Agentをリリースした。

Microsoftのストーリーによると、2025年は「エージェント時代、どの基準とフレームワークを使うべきか」を解決した年であり、2026年は「自社モデルと製品をどうやって本格的に動かすか」に焦点を当てている——モデル層には主導できる自社開発の主力を補完し、製品層ではエージェントをデモからシステム、ハードウェア、クラウドの全スタックに展開した。

今回の発表会の核心は六つのセクションに分かれる:MAI自社モデル群、ScoutとGitHub Copilotを代表とするエージェントエコシステム、WindowsシステムレベルのAIセキュアサンドボックスMXC、開発者向けSurface RTX Spark Dev Boxとシステム最適化、Project Solaraの新型エージェントデバイスプラットフォーム、そしてMicrosoft IQ、Rayfin、ASSERT、ACSなどの開発者ツールとガバナンスフレームワーク。

01 七つのモデルをゼロから訓練、蒸留を拒否

全体の基調講演はMicrosoft CEOサティア・ナデラのビジョン表明を軸に展開された。彼は「エージェント優先」の戦略フレームワークを提示し、その後各事業部門の幹部が次々に登壇し、このフレームワークを具体的な製品に落とし込んだ。

大会では、スレイマンがMicrosoft AI内部で開発した新しい七つのモデルを発表し、これらを統一してMAIファミリーに分類した。

彼はMAIの使命を「登山ロボットの構築」と表現し、計算量の継続投入、より良いデータ、より正確な評価を通じて、循環的な自己改善を実現し、ユーザーを常に技術の最前線に保つことを目指す。

訓練計算規模について、スレイマンは最先端モデルの訓練に必要な計算量が1兆倍に増加し、今後3年でさらに千倍に拡大すると指摘した。MicrosoftのすべてのMAIモデルは「ゼロから登山を始め、蒸留を一切行わず」、サードパーティモデルの出力に依存しない。

Microsoft AI部門責任者のスレイマンが自社開発モデル七つを紹介

具体的なモデルは以下の通り:

フラッグシップ推論モデルのMAI-Thinking-1は中型モデル。Microsoftは、重要なソフトウェアエンジニアリングのテストにおいて、市場最高のモデルと遜色ない性能を示すと述べている。ブラインドテストでは、人間の評価者の好みもSonnet 4.6とほぼ同等だった。このモデルはゼロから、クリーンなデータで訓練され、サードパーティモデルの蒸留は行っていない。

プログラミングモデルのMAI-Code-1-Flashは推論効率の高いエージェント型コーディングモデルで、パラメータは50億。GitHub Copilot、VS Code、Microsoftの技術スタックに深く統合されており、Haikuと匹敵しながらコストは低いとMicrosoftは述べている。

テキストから画像への生成モデルのMAI-Image-2.5とその超高効率版のFlashは、テキストから画像生成と画像編集をサポートし、Google Nano Banana Proを超えるArenaスコアを獲得したとMicrosoftは称賛。

文字起こしモデルのMAI-Transcribe-1.5はSOTAレベルの精度を持ち、競合モデルより5倍速く、43言語の専門用語認識を内蔵。

音声生成モデルのMAI-Voice-2は高品質で自然な音声を生成し、15言語に対応。短いサンプルから声を適応させることができ、乱用防止策も備える。Flash版は近日登場し、コストを抑えつつ同じ機能を実現。

これらすべてのモデルは、同じデータ規範、インフラ、評価フレームワークを共有。Azure Foundryで配布され、Microsoftの第一方製品向けに最適化されるほか、Open RouterやFireworks、Basetenでも開発者に提供される。開発者は初めてモデルの重みを調整可能。

会議でナデラは、Microsoft Frontier Tuningを紹介した。これは企業が自社の業務データを使ってモデルをカスタマイズする方法だ。最も価値のあるデータは一般的なコーパスではなく、エージェントが企業内でタスクを実行する際の実際の軌跡、ステップ、意思決定だ。

Microsoft CEOナデラがFrontier Tuningを紹介

この仕組みは、MAIモデルを実際の業務フローに接続し、リアル環境で学習させることを可能にする。スレイマンは「あなた自身のモデルを構築しているのです。あなたの環境で、あなたのデータを使って訓練し、あなたがコントロールする。あなたの組織知識がモデルの一部となり、あなたにだけ属する」と語った。

効果として、Excel向けに調整されたMAIモデルはGPT-5.4と同等の性能を持ち、効率は10倍向上。マッキンゼーがFrontier Tuningを採用した結果、MAIはすべてのテストモデル中最高勝率を記録し、コストも約10分の1に削減された。

医療分野では、Microsoftはメイヨークリニックと提携し、医療用最先端AIモデルを共同開発すると発表した。このモデルは、メイヨーの臨床知識、識別化された臨床データ、縦断的インサイトとMicrosoftの基盤AI能力を融合させる。

また、MAIモデルは自社開発のMaia 200チップと協調設計されており、ハードウェアとソフトウェアの連携最適化により、1.4倍の効率向上を実現している。

02 エージェントエコシステムの全面展開

Microsoftは大会で、「エージェント優先」への大規模な変革を宣言し、知識労働者のソフトウェア利用を自動化し、AIアシスタントを日常のオフィス交流に組み込むことを目指す。

Scoutは今回のリリースの中心的エージェント製品。この「常時オンライン」のAIエージェントは、OpenClawフレームワーク上に構築され、Microsoft Teams内で人間の同僚と同じようにやり取りできる。

Scoutはユーザーのメッセージ、カレンダー、メールボックスを閲覧し、自動的にタスクを完了させたり、会議の衝突を再調整したり、専門的に聞こえる返信を草稿したりできる。Teams内から直接指示を送ることも、名前を付けて呼び出すことも可能。

Microsoftの新任企業副社長オマール・シャヒンは、Scoutの設計理念を次のように説明した:「あなたの会社は本質的にあなたのアシスタントを雇っているのと同じです。プライベートアシスタントを持つ意味は、あなたが仕事を離れているときも彼らが働き続けることにあります。」

ScoutはMicrosoft Frontierプランを通じて提供され、GitHub Copilotのサブスクリプションが必要。Microsoftは、Scoutのデスクトップアプリも試験的に開発中で、「先端」機能へのアクセス権を持つサブスクライバーに提供予定だ。社内では、営業部門が最も多く、最も急速に利用を拡大しているとシャヒンは語る。

GitHub Copilotのデスクトップアプリも重要なリリースの一つ。Mario Rodriguez(GitHubのプロダクト責任者)は、「GitHub上に構築されたエージェントネイティブのデスクトップ体験」と紹介した。

「My Work」ビューを通じて、開発者は複数リポジトリにまたがる動的な作業状況を確認できる。アクティブセッション、議題、プルリクエスト、バックグラウンドの自動化を一元管理。各セッションは独自のGitワークツリー内で動作し、並列のエージェントは干渉しない。エージェントのマージ機能も備え、プルリクエストのレビュー、検査、マージをリード。Canvasインターフェースは人とAIの双方向対話を可能にし、開発者はエージェントが行った作業を確認・誘導・検証できる。

このGitHub CopilotアプリはWindows 11、Windows on Arm、Mac、Linux向けに技術プレビューを提供し、GitHub Copilotのサブスクリプションが必要。将来的には無料版Copilotユーザーにも開放予定。クラウドとローカルのサンドボックス、コードレビューもサポートし、両者ともポリシーによる管理が可能。

エージェントのセキュリティガバナンス面では、MicrosoftはACS(Agent Control Standard)を発表。これは新しいオープンソース標準で、開発者にAIエージェントの行動をより一貫性・詳細に制御する方法を提供する。ACSは、開発・コンプライアンス・セキュリティチームがエージェントのポリシーファイルを定義できる仕組みで、「何をできるか」「絶対にやってはいけないこと」「人間の承認が必要なタイミング」「証拠の記録」などを規定できる。

ACSはSDKとして公開され、LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCPツールなどのプラグインも付属。ポリシーは単一ファイルに記述でき、エージェントにバンドルして異なるフレームワークや環境を跨いで運用できる。

ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)はもう一つのテストツール。これはオープンソースのフレームワークで、AIに対して高レベルの自然言語記述を用いて目標や戦略、期待動作を変換し、構造化されたスコアリングテストに落とし込む。

ASSERTはAIモデルの期待動作を簡潔な言語で記述し、許容・不許容の動作集合、問題シナリオ、テストケースを生成、システムに対してテストとスコアリングを行う。さらに、途中の操作やツール呼び出しも記録し、失敗箇所の検証を支援する。

03 エージェントの自律性が高まるほど危険も増大、MicrosoftはMXCでシステムレベルのリミットを引く

AIエージェントの能力と自主性が高まるにつれ、Microsoftは重要な問題を認識した。それは、「エージェントの自主性が高まるほど有用だが、企業ネットワーク上で制約なく動かすのは危険」という点だ。Microsoftの公式ブログはこれを「多層システムの問題」と表現し、エージェントと人間、ツール、アプリ、モデル、他のエージェントとの相互作用は「新たな攻撃面を露呈し、さまざまな故障モードを引き起こす」と指摘している。

この問題に対処するため、MicrosoftはMicrosoft Execution Containers(MXC)を導入した。これはWindows OSに内蔵された、ポリシー駆動の実行層である。WindowsとDeviceのエグゼクティブ副社長パワン・ダヴルリは、「これがAIエージェントの商用化にとって極めて重要だ」と述べ、「安全性、包含、隔離、ユーザーコントロールを重視した設計」としている。これにより、エージェントの一般消費者や企業導入において十分な安全性を確保できる。

Microsoft CEOナデラはシステムレベルのセキュアサンドボックスMXCを紹介

MXCは本質的にSDKとポリシーモデルであり、WindowsやWindows Subsystem for Linuxに埋め込まれ、Microsoftが「組み合わせ可能なサンドボックススペクトラム」と呼ぶ範囲を提供する。軽量なプロセス隔離(GitHub CopilotのCLI採用済み)から、マイクロ仮想マシン、Linuxコンテナ、Windows 365上の完全なクラウドインスタンスまで、多彩な隔離レベルを持つ。

このシステムは、エージェントの実行とユーザーのデスクトップ、クリップボード、UI、入力デバイスを分離。各エージェントはIDに紐づき、ローカルIDまたはMicrosoft EntraサポートのクラウドプリプロビジョンドIDを持ち、すべての動作は追跡・監査・ガバナンス可能となる。

MXCは既にプレビュー版を提供中。Microsoft Enterprise Security Stackと連携したAgent 365は2026年7月にプレビューを開始予定で、Entra ID、Intuneデバイス管理、Defender脅威防御、PurviewデータガバナンスをMXCに重ね、IT部門による集中管理と隔離を実現する。

パートナー企業では、OpenAI、NVIDIA、Manus、Nous Research(Hermesエージェントの製造元)、OpenClawオープンソースプロジェクトがMXC上に構築を発表した。

特に、OpenClawの協力は、創始者のピーター・スタインバーグがMicrosoftに協力関心を持ち、全面的なプラットフォームパートナーシップに発展した。

04 EdgeのAI「オフラインでも動作」する三つのアップデート

Microsoft EdgeブラウザもローカルAI能力のアップグレードを受けた。Build 2025でPhi-4-miniを導入して以来、Web開発者のフィードバックをもとに端末側AI能力を拡張した。

第一はAion-1.0-Instruct。Phi-4-miniより小さく高速で効率的なローカル小型言語モデル。GPUや低性能CPUのPCでも動作し、開発者プレビュー版として7月にHugging Faceに登場予定。

第二は言語検出と翻訳API。Edge 148バージョンとともに提供される。これらはEdge内蔵の端末側AIモデルを駆動し、JavaScript向けに設計。ウェブサイトやブラウザ拡張がテキストの言語を識別し、言語対間の翻訳を可能にする。Microsoftは「高速・高品質な翻訳を提供し、145以上の言語をサポート。ネット上の翻訳負荷に最適化」と述べ、無料サービスとした。

第三はWeb Speech APIによる音声認識。Edge CanaryとDevチャネルで実験的に提供されている。これにより、開発者は音声や音声入力をウェブサイトや拡張に組み込み、デバイス上で動作させるほか、クラウドの音声認識・テキスト変換サービスも利用可能。

05 開発者ツールとクラウドサービスの進化

データインテリジェンス層では、MicrosoftはMicrosoft IQを発表。これまで個別に存在した4つのコンテキストソースをエージェントの共有基盤に統合した。

Microsoft Fabric CTOのアミール・ナイツは例えた:「『マトリックス』の緑のコードの滝は飾りではなく、その世界の土台だ。私たちがデータの世界でやっていることは、エージェントにデータに基づく現実を作らせることだ」と。

Microsoft IQの4つのコンテキスト源は次の通り:Work IQ(組織の日常運営を捉える、メール・ドキュメント・会議・スケジュールを利用)、Foundry IQ(組織知識の管理と索引)、Fabric IQ(データを用いたビジネスのリアルタイム運用状態のモデル化、リアルタイム信号に基づくエンティティ・関係・ビジネスルールの定義。今後数ヶ月で正式公開予定)、Web IQ(ネットからのリアルタイムグローバルコンテキストを追加)。

このコンテキスト体系により、エージェントは命令を実行するツールから、企業の運営状況を理解する仮想社員へと進化する。

ただし、共有の「土台」だけでは不十分だ。エージェントがアプリを生成し始めると、それぞれのアプリにはバックエンドが必要となる。放置すれば、これらのアプリはコンテキスト層の外に新たなデータ孤島を形成する。そこでMicrosoftはRayfinを発表。これはオープンソースのSDKとCLIで、エージェントが構築したアプリを直接Fabricプラットフォームに展開し、管理された生産バックエンドとして運用できる。アプリのデータはデフォルトでOneLakeに入り、Microsoft IQにフィードバックされる。外部にデータが蓄積されることはない。

これをMicrosoftは、SupabaseやNeonの競合と位置付ける。最大の違いはガバナンスにあり、すべてのアプリは同じデータ・コンプライアンス経路を通る。ナイツは「これは双方向のプロセスだ」と述べる。エージェントがアプリを構築する際、企業のデータルールから情報を取り出し、アプリが動き出すと、そのデータがルールを更新し、次のエージェントは最新の情報を使えるようになる。

また、MicrosoftはWSLコンテナ機能も発表。これにより、開発者はWindows上で直接Linuxコンテナを作成・管理できる。コマンドラインとAPIも用意され、ローカルのWindowsアプリ内でLinuxコンテナを動かせる。この機能は今後数ヶ月で公開プレビューを提供予定。

環境設定にかかる時間を短縮するため、MicrosoftはWindows Developer Configurationsもリリース。新しいマシンの素早いセットアップと開発者向け最適化設定の適用を可能にし、WSL、PowerShell 7、Visual Studio Codeの自動インストール、ファイルエクスプローラーでのGitバージョン管理と隠しファイル表示を自動化。

06 二つの新ハードウェア、AIをローカルに呼び戻す

このBuildは、モデルやエージェント、開発ツールだけでなくハードウェアも登場。AI計算には大量の演算能力が必要となり、エージェントのワークフローも継続的に動作させる必要があるため、Microsoftは開発者の手元のデバイスに目を向けた。高価なクラウドGPUを借りるのではなく、これらの作業をローカルマシンで完結させる。

Surface製品担当副社長のアンドリュー・ヒルは、二つの新デバイスを発表した。

Surface RTX Spark Dev Boxはコンパクトな開発者向けPC。NVIDIA RTX Spark超級チップを搭載し、NVIDIA Blackwell RTX GPUとNVIDIA Grace CPUを組み合わせ、最大1ペタフロップのAI演算能力を提供。128GBの統一メモリを備える。

アルミ製のケース兼放熱器を採用し、長時間の訓練、大規模モデル推論、複雑なエージェントワークフローに最適化。Windows 11 Proをプリインストールし、ダークテーマ、簡素化されたタスクバー、ウィジェットの除去、「おやすみモード」有効化、開発者モード有効化、PowerShell 7をデフォルトシェルに設定。WSL 2はGPUパススルーとCUDAサポートを完備し、VS Code、GitHub Copilot、Git、Python、Node.jsもインストール済み。

セキュリティ面では、Secured-core PCアーキテクチャ、BitLocker暗号化、Microsoft Defender保護を備え、Entra IDやIntuneとも連携可能。大規模な管理とガバナンスを実現。

ヒルは、「開発者のソフトウェア構築方法は根本的に変わりつつある。AIモデルの能力と複雑さは増大し、エージェント型ワークフローは継続的な計算能力を必要とし、最先端モデルを使わないタスクでもクラウドコストがかかる」と語る。

もう一つはSurface Laptop Ultra。これは開発者、クリエイター、技術者向けの高性能ノートPCで、早期に発表済み。これらはSurfaceの次のステップを示し、未来の構築を目指す専用デバイスとなる。Surface RTX Spark Dev Boxは今年後半に米国で発売予定で、Microsoft.com限定販売。

07 デバイス上でAIエージェントを動かす新プラットフォーム

Microsoftアプリ科学部門責任者のスティーブ・バティッシュは、Project Solaraと呼ばれる内部プロジェクトを紹介した。

これは、チップからクラウドまでの新しいプラットフォームで、WindowsではなくAndroidを基盤とし、デバイス上でアプリではなくAIエージェントを動かすことを目的とする。バティッシュはその出発点を次のように説明した:「境界線が崩壊している。従来のアプリの枠組みは必ずしも必要ではない。新しい体験の開発方法も必要ない。」

Build大会では、最初の二つのコンセプトデバイスも披露された。

一つはデスクトップ中心のデバイス。PCの横に置き、音声コマンドに応答し、顔認証でログイン。日々の最重要事項を表示。ディスプレイに接続すれば、クラウド上で動作する完全なWindowsマシンに変身。

もう一つはウェアラブル社員証デバイス。標準の社員IDカードを再構築し、指紋一つでエージェントを呼び出し、会話を録音・文字起こし。内蔵カメラで、見たものに基づき行動を起こす。

医療現場のデモでは、医療従事者向けのエージェントが動作。患者のQRコードをスキャンし、診療過程を記録・文字起こし、バイタルサインを記録し処方を出す。別のアプリでは、ブレインストーミングボードのアイデアに基づき、観葉植物の追加提案も行った。

バティッシュは、「Microsoftはこれらのデバイスを自社で作ることはない。ハードウェアメーカーや他業界のパートナーがこれらのリファレンスデザインを自社製品に変換し、特定の業界やシナリオに合わせて展開していく」と述べた。

08 量子チップのアップグレード、信頼性千倍向上

Microsoftは次世代のトポロジカル量子チップ「Majorana 2」も発表した。

前世代のMajorana 1と比較して、コアの変更点は超伝導体材料をアルミから鉛に変更したこと。これにより、量子ビットの信頼性は1000倍向上し、平均寿命は20秒に達し、一部の例では1分以上持続可能となった。

他の技術路線の量子ビットは通常数マイクロ秒の寿命しか持たない。これにより、Microsoftはスケーラブルな量子計算機の実現時期を半分に短縮し、2029年までに達成できる見込みだ。

このチップの開発には、Microsoft DiscoveryプラットフォームのエージェントAI能力が全面的に活用された。AIエージェントは、製造管理、量子状態の自動測定、学際的なデータ分析などを担い、従来数週間かかっていた測定周期を数桁圧縮し、20年近くの蓄積データから人間には気づきにくい関連性を抽出した。

Microsoftの技術院士チータン・ナヤクは、「Agentic AIは私たちのすべてに浸透している」と述べる一方、「AIはあくまで指導役であり、科学者の回路の中にある」と強調した。

また、Microsoft Discoveryプラットフォームも本大会で正式リリース。これは最先端研究向けの組織レベルのプラットフォームで、研究者が人間の指導のもとで自主的にエージェントチームを展開し、仮説生成や実験最適化、理論検証を行える。Microsoft Discoveryアプリの早期プレビューも公開され、個人はGitHub Copilotアカウントでローカルにダウンロードして利用できる。

特約翻訳者の金鹿も本稿に協力した。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め