微軟 Build 2026 開發者大會:「Agent 優先」時代到來,一口氣發佈七款自研模型

文丨李海倫

編輯丨徐青陽

美國當地時間 6月 2 日,微軟 Build 2026 開發者大會在舊金山梅森堡拉開帷幕。此次大會主題聚焦於前沿 AI 技術的實戰應用,微軟發布了一系列涵蓋自研 AI 模型、智能體應用、操作系統安全、開發者工具、雲服務及新型硬體平台的產品與更新。

在 2025 年的開發者大會,微軟確立了“AI 智能體時代”方向,發布了 Copilot Studio 多智能體編排、Windows AI Foundry,並宣布全面支持 Model Context Protocol,GitHub Copilot 推出編程智能體 Coding Agent。

在微軟的敘事中,2025 年解決的是“智能體時代,該用什麼標準和框架”,2026 年聚焦的是“如何用自家的模型和產品,真正跑起來”——模型層補上了能挑大梁的自研主力,產品層把智能體從演示推向了系統、硬體和雲的全棧落地。

這次發布會,核心發布可分為六個板塊:MAI 自研模型家族、以 Scout 和 GitHub Copilot 應用為代表的智能體生態、Windows 系統級 AI 安全沙箱 MXC、面向開發者的 Surface RTX Spark Dev Box 與系統優化、Project Solara 新型智能體設備平台,以及包括 Microsoft IQ、Rayfin、ASSERT、ACS 等在內的開發者工具與治理框架。

01 七款模型從零訓練,拒絕蒸餾

整場主題演講以微軟 CEO 薩提亞·納德拉的願景陳述為主線徐徐展開。他抛出“智能體優先”的戰略框架後,各業務線高管依次登台,推出具體產品把這套框架落到實處。

在大會上,蘇萊曼宣布推出七款由微軟 AI 內部開發的全新模型,統一歸入 MAI 家族。

他將 MAI 的使命描述為構建一台“爬山機器”,通過持續投入計算量、更優數據和更精准評估,实现循環往復的自我改進,讓用戶始終保持在技術前沿。

訓練計算規模方面,蘇萊曼指出,用於訓練前沿模型的計算量已增長一萬億倍,預計未來三年內還將再增長一千倍。微軟所有 MAI 模型均“從零開始進行爬山,零蒸餾”,不依賴第三方模型輸出進行訓練。

微軟 AI 部門負責人蘇萊曼介紹七款自研模型

具體模型如下:

旗艦推理模型 MAI-Thinking-1,這是一個中型模型。微軟表示,它在關鍵的軟體工程測試中,性能可以跟市面上最好的模型打平。在盲測對比中,人類評判員對它的偏好程度跟 Sonnet 4.6 不相上下。這個模型是從零開始、用乾淨數據訓練,未使用第三方模型蒸餾。

編程模型 MAI-Code-1-Flash,是一個推理高效的 agentic 編碼模型,擁有 50 億參數,專為 GitHub Copilot、VS Code 和微軟技術棧量身定制並深度集成。微軟表示其可與 Haiku 媲美但成本更低。

文生圖模型 MAI-Image-2.5 及其超高效 Flash 變體,支持文生圖和圖像編輯,微軟稱其在 Arena 評分上超越了谷歌 Nano Banana Pro。

轉錄模型 MAI-Transcribe-1.5,具備 SOTA 級別準確性。據稱速度比競品模型快五倍,內置支持 43 種語言的領域特定術語識別。

語音生成模型 MAI-Voice-2,提供高質量、自然聽感的語音生成,支持 15 種語言,能夠根據短樣本適配聲音,具備防濫用保護措施。其 Flash 變體即將推出,以更低成本實現同樣功能。

所有模型共享相同的數據規範、基礎設施和評估框架。除了在 Azure Foundry 上分發並為微軟第一方產品優化外,這些模型還將在 Open Router 以及 Fireworks 和 Baseten 上向開發者提供。開發者首次能夠自行調整模型權重。

在會上,納德拉介紹了 Microsoft Frontier Tuning,一種讓企業用自身工作數據定制模型的方法。其邏輯是,最有價值的數據不是通用語料,而是智能體在企業裡執行任務的真實軌跡、步驟和決策。

微軟 CEO 納德拉介紹 Frontier Tuning

這套機制把 MAI 模型接入實際業務流程,讓模型在真實環境中邊做邊學。蘇萊曼說:“你正在構建自己的模型:在你的環境中,用你的數據訓練,由你控制。你的機構知識會成為模型的一部分,並且只屬於你。”

效果方面,微軟為 Excel 調整的 MAI 模型與 GPT-5.4 水平相當,同時效率提高 10 倍。麥肯錫採用 Frontier Tuning 後,MAI 在所有測試模型中實現最高勝率,成本降低約 10 倍。

在醫療健康領域,微軟宣布與梅奧診所合作,共同打造一個用於醫療保健的前沿 AI 模型。該模型將梅奧診所的臨床專業知識、去標識化的臨床數據和縱向洞察,與微軟的基礎 AI 能力結合。

微軟同時透露,MAI 模型正與自研的 Maia 200 芯片進行協同設計,通過軟硬體聯合優化已實現 1.4 倍的效率提升。

02 智能體生態全面落地

微軟在大會上宣告了向“Agent 優先”的宏大轉型,旨在自動化知識工作者使用軟體的方式,將 AI 助手植入日常辦公交互中。

Scout 是此次發布的核心智能體產品。這款被稱為“永遠在線”的 AI Agent,構建於 OpenClaw 框架之上,可在 Microsoft Teams 中像人類同事一樣交互。

Scout 能瀏覽用戶的工作消息、日曆和電子郵件收件箱,自動完成任務、重新安排衝突會議,並起草聽起來很專業的回覆。用戶可在 Teams 中直接向它發送指令,也可以為它命名。

微軟新任命的企業副總裁奧馬爾·沙欣解釋了 Scout 的設計理念:“你的公司本質上就是雇佣了你的助理。擁有私人助理的全部意義在於,當你不在工作時,他們還在工作。”

Scout 通過微軟 Frontier 計畫提供,需要 GitHub Copilot 訂閱。微軟正測試一款 Scout 桌面應用,將向選擇“前沿”功能訪問權限的訂閱用戶推出。在微軟內部,沙欣說銷售部門是使用該工具最大、增長最快的群體。

GitHub Copilot 桌面應用是另一項重要發布。GitHub 首席產品官馬里奧·羅德里格斯(Mario Rodriguez)介紹,這是一款“構建在 GitHub 之上的、Agent 原生的桌面體驗”。

通過統一的“我的工作”視圖,開發者可看到跨連接倉庫的動態工作,包括活動會話、議題、拉取請求和背景自動化。每個會話在其自己的 Git worktree 中運行,並行 Agent 互不干擾。應用具備 Agent Merge 功能,可帶領拉取請求完成審查、檢查和合併。Canvas 界面用於人機之間的雙向交互,開發者可檢查、引導和驗證 Agent 代表自己執行的工作。

GitHub Copilot 應用面向 Windows 11、Windows 11 on Arm、Mac 和 Linux 提供技術預覽版,需要 GitHub Copilot 訂閱,未來將向 Copilot Free 用戶開放。該應用支持雲端和本地沙箱、代碼審查,兩者均附帶策略支持。

在智能體安全治理方面,微軟發布了 Agent 控制規範(ACS),這是一個新的開源標準,旨在為開發者提供更一致、更細粒度的方法來控制 AI Agent 的行為。ACS 讓開發、合規和安全團隊能夠為 Agent 定義策略文件,規定 Agent 可以做什麼、絕對不能做什麼、何時需要人類批准,以及應記錄哪些證據供審查。

ACS 作為一個 SDK 發布,附帶 LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCP 工具等的插件。由於策略可寫成單個文件,可以與 Agent 捆綁在一起,跟隨 Agent 穿越不同框架和環境。

ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)是另一項測試工具。這是一個開源框架,通過使用 AI 將對目標、策略或預期行為的高級自然語言描述,轉化為結構化的評分測試。

ASSERT 接收關於 AI 模型預期行為的簡明語言描述,生成可接受與不可接受行為集合、問題場景和測試用例,針對目標系統運行測試並評分。它還能記錄 AI 系統所採取的路徑,包括中間操作和工具調用,以便開發者檢查失敗位置。

03 Agent 越自主越危險,微軟用 MXC 在系統層劃紅線

隨著 AI Agent 日益強大和自主,微軟識別出一個關鍵問題:Agent 越自主越有用,讓它不受護欄約束地在企業網絡上運行就越危險。微軟官方部落格將此描述為一個“多層系統問題”,Agent 與人類、工具、應用、模型以及其他 Agent 之間的每一次交互“都會暴露新的攻擊面,並引入不同的故障模式”。

針對這一問題,微軟推出了 Microsoft Execution Containers(MXC),這是一個內置在 Windows 操作系統本身的、由策略驅動的執行層。微軟 Windows 和設備執行副總裁帕萬·達武魯里強調,這對於使 AI Agent 具有商業可行性至關重要,它們“圍繞安全性、包含、隔離和讓用戶控制”,將使 Agent 對普通消費者和企業部署來說足夠安全。

微軟 CEO 納德拉介紹系統級安全沙箱 MXC

MXC 本質上是一個 SDK 和策略模型,嵌入在 Windows 和 Windows Subsystem for Linux 中,提供微軟所稱的“可組合的沙箱頻譜”。該頻譜範圍從輕量級進程隔離(已被 GitHub Copilot 的命令行界面採用),延伸到微型虛擬機、Linux 容器,以及在 Windows 365 上運行的完整雲實例。

該系統將 Agent 的執行與用戶的桌面、剪貼簿、用戶界面和輸入設備分離開。每個 Agent 被綁定到一個身份,要麼是本地 ID,要麼是由 Microsoft Entra 支持的雲預配身份,確保 Agent 的每一個動作都可被歸因、審計和治理。

MXC 現已提供早期預覽版。與微軟企業安全棧集成的 Agent 365 將於 2026 年 7 月推出預覽版,將 Entra 身份服務、Intune 設備管理、Defender 威脅防護和 Purview 數據治理能力層疊到 MXC 之上,使 IT 部門能集中管理 Agent 隔離。

在合作夥伴方面,OpenAI、英偉達、Manus、Nous Research(Hermes Agent 製造商)以及 OpenClaw 開源項目已宣布在 MXC 上構建。

值得一提的是,OpenClaw 的合作,是創建者彼得·斯坦伯格(Peter Steinberger)主動聯繫微軟表達合作興趣,最終這事發展成了全面的平台級夥伴關係。

04 三項更新,讓 Edge 的 AI"不聯網也能跑"

微軟 Edge 瀏覽器也獲得了本地 AI 能力升級。微軟表示,自 Build 2025 引入 Phi-4-mini 後,團隊根據網頁開發者反饋擴展了端側 AI 能力。

第一項是 Aion-1.0-Instruct,一個比 Phi-4-mini 更小、更快、更高效的本地小語言模型。它可在 GPU 和 CPU 能力較弱的 PC 上運行,現以開發者預覽版提供,將於 7 月登陸 Hugging Face。

第二項是語言檢測和翻譯 API,隨 Edge 148 版本提供。這兩個 API 由 Edge 內置的端側 AI 模型驅動,用於 JavaScript,允許網站和瀏覽器擴展識別文本語言並在語言對之間翻譯。微軟稱其“提供快速、高質量的翻譯,支持超過 145 種語言,並針對網路上的翻譯工作負載進行了優化”,此服務免費。

第三項是通過 Web Speech API 實現語音識別,在 Edge Canary 和 Dev 頻道中以實驗形式提供。該 API 幫助開發者將語音或音頻輸入整合到網站和瀏覽器擴展中,在設備本地運行,也可基於雲端語音轉文本和文本轉語音服務作為後盾。

05 開發者工具與雲服務迭代

在數據智能層面,微軟發布了 Microsoft IQ,把此前各自獨立的四個上下文源合併成 Agent 的共享基礎。

微軟 Fabric 首席技術官阿米爾·內茨打了個比方:《黑客帝國》裡那些綠色代碼瀑布不是裝飾,而是構建那個世界的基礎。他說,“我們在數據世界做的事,就是給 Agent 造一個基於數據的現實”。

Microsoft IQ 的四個上下文源分別為:Work IQ,捕獲組織日常運作方式,利用電子郵件、文檔、會議和日程安排;Foundry IQ,管理機構知識,策劃和索引知識庫;Fabric IQ,通過數據對業務的實時運營狀態進行建模,定義基於 Fabric 實時智能的實時信號所錨定的實體、關係和業務規則,該功能預計在未來幾個月正式發布;Web IQ,添加來自網路的實時全球上下文。

有了這套上下文體系,Agent 就不再是一個只會執行命令的工具,而是一個了解公司運轉情況的虛擬員工。

光有共享的“地基”還不夠。當 Agent 開始生成應用時,每個應用都需要一個後端,如果放任不管,這些應用就會在上下文層之外形成新的數據孤島。為此微軟發布了 Rayfin,一個開源 SDK 和 CLI,它把 Agent 構建的應用直接部署到 Fabric 平台作為受治理的生產後端,應用數據默認進入統一的 OneLake 數據湖,再反饋回 Microsoft IQ,而不是在外部堆積。

微軟將它定位為 Supabase 和 Neon 的競爭對手,核心區別就是治理:所有應用都走同一套數據和合規通道。內茨說這是個雙向過程,Agent 建應用時從企業的數據規則裡取信息,應用跑起來產生的數據又反過來更新這套規則,下個 Agent 就能用上最新的東西。

微軟同時推出的 WSL 容器功能,讓開發者能在 Windows 上直接創建和管理 Linux 容器,微軟還給它配了命令行界面和 API,允許在本機 Windows 應用裡運行 Linux 容器,這個功能將在未來幾個月提供公開預覽。

為了不讓開發者在環境配置上浪費時間,微軟還發布了 Windows Developer Configurations,可以快速設置一台新機器並套用開發者優化配置,自動安裝 WSL、PowerShell 7 和 Visual Studio Code,同時在檔案資源管理器裡啟用 Git 版本控制並顯示隱藏檔。

06 兩款新硬體,把 AI 重活拉回本地端

這場 Build 不只是模型、Agent 和開發工具的軟體秀,硬體也沒缺席。當 AI 計算越來越吃算力、Agentic 工作流又需要持續不斷地跑,微軟索性把目光投向了開發者手邊的設備,與其每次都去租昂貴的雲 GPU,不如讓這些活兒直接在本地機器上完成。

Surface 產品公司副總裁安德魯·希爾宣布了兩款新設備:

Surface RTX Spark Dev Box 是一款緊湊型開發者 PC,搭載 NVIDIA RTX Spark 超級晶片,結合 NVIDIA Blackwell RTX GPU 和 NVIDIA Grace CPU,提供高達 1 Petaflop 的 AI 算力,配備 128 GB 統一內存。

該設備採用鋁製機箱兼作散熱器,專為長時間運行的訓練任務、大模型推理和複雜 Agentic 流程設計。設備預裝 Windows 11 Pro,並在映像層面為開發者預配置:深色主題、為開發簡化的任務欄、移除小工具、開啟“請勿打擾”模式、開發者模式已啟用、PowerShell 7 為預設 Shell。WSL 2 已配置好 GPU 直通和 CUDA 支持,VS Code、GitHub Copilot、Git、Python 和 Node.js 均已安裝。

安全方面,Surface RTX Spark Dev Box 建立在符合微軟零信任原則的晶片到雲安全之上,包括 Secured-core PC 架構、BitLocker 加密和 Microsoft Defender 保護,並可與 Entra ID 和 Intune 整合實現大規模管理和治理。

希爾解釋稱:“開發者構建軟體的方式正在發生根本性變化。AI 模型的能力和複雜性日益增長,Agentic 工作流需要持續的計算能力,而且即便是那些不需要最先進模型的任務,每一次迭代也可能產生雲端成本”。

另一款 Surface Laptop Ultra 專為開發者、創作者和技術專業人士設計的高性能筆記本電腦,已經於早些時候推出,兩者共同代表 Surface 的下一步:為構建未來的人們打造專用設備。Surface RTX Spark Dev Box 將於今年晚些時候在美國上市,僅在 Microsoft.com 獨家銷售。

07 讓設備運行 AI Agent 而非應用的新平台

微軟應用科學部門負責人史蒂維·巴蒂什介紹了被稱為 Project Solara 的內部項目。

這是一個從晶片到雲的新平台,基於 Android 而非 Windows,旨在讓設備運行 AI Agent 而非應用。巴蒂什解釋其出發點:“界限正在崩塌。你不一定需要傳統的應用模式。你不需要傳統的方式來開發體驗。”

首批兩款概念設備已在 Build 大會上展示:

桌面中心設備,放在 PC 旁邊,響應語音命令,通過面部識別登錄用戶,呈現當天最緊急的事項。連接顯示器後可變成一台在雲端運行的完整 Windows 機器。

可穿戴工牌設備,重新構想了標準員工 ID 卡。一鍵按下指紋即可喚醒 Agent,輕觸可錄製和轉錄對話,內置攝像頭讓 Agent 能根據用戶所見採取行動。

在醫療保健演示中,這款工牌運行了為醫護人員設計的 Agent,能掃描患者二維碼、記錄和轉錄就診過程、記錄生命體徵並開出处方。在另一個應用中,內置攝像頭掃描了寫著辦公室改造創意的頭腦風暴板,並提出了添加綠植的建議。

巴蒂什表示,微軟不會自己生產這些設備,而是設想硬體製造商和其他行業合作夥伴將這些參考設計轉化為自己的產品,每個都針對特定行業、公司或場景。

08 量子晶片升級,可靠性提升千倍

微軟還發布了下一代拓撲量子晶片 Majorana 2。

相比前代 Majorana 1,這次的核心變化是超導體材料從鋁換成鉛,這一調整使量子比特可靠性提升 1000 倍,平均量子比特壽命達到 20 秒,部分實例可持續一分鐘。

其他技術路線的量子比特壽命通常僅微秒級。基於這一進展,微軟將可擴展量子計算機的預期實現時間縮短一半,目前預計在 2029 年前達成。

該晶片的研發全程使用了 Microsoft Discovery 平台的 Agentic AI 能力。AI 智能體承擔了製造管理、量子態自動化測量和跨學科數據分析等任務,將原本數周的測量週期壓縮了幾個數量級,並從近二十年積累的數據中識別出人類難以察覺的關聯。

微軟技術院士切坦·納亞克說:“Agentic AI 幾乎滲透到我們所做的一切事情中。”但他強調 AI 只提供指導,“始終是科學家在回路中”。

Microsoft Discovery 平台也於本次大會正式發布,這是一個面向前沿研發的組織級平台,允許研究人員部署由人類指導的自主 Agent 團隊,進行假設生成、實驗優化和理論驗證。微軟同時推出了 Microsoft Discovery 應用的早期預覽版,個人可免费下载,使用 GitHub Copilot 賬戶在本地運行。

特約編譯金鹿對本文亦有貢獻。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆