隨著企業AI使用成本持續攀升,一類名為「模型路由器」的技術正迅速從邊緣工具走向主流。這類系統能夠根據任務複雜程度自動調配最合適的AI模型,在不顯著犧牲品質的前提下大幅壓縮開支,正在吸引從初創公司到大型企業的廣泛關注。
模型路由器的核心邏輯在於:並非所有任務都需要最昂貴的前沿模型。總結郵件、檢索文檔等基礎工作完全可以交由開源模型或舊版專有模型處理,成本僅為頂級模型的一小部分。Snowflake和Palo Alto Networks等企業已向The Information證實,透過為特定任務替換更廉價的模型,實現了可觀的成本節約。
這一趨勢正在催生真實的商業回報。建築公司McCarthy Building表示,透過Palantir的路由工具Evolve,其當季AI token使用量較去年同期減少了60%。Palantir自身也揭露,在一個具體案例中,該工具透過將任務從OpenAI的GPT-5.1切換至更小的GPT-5.4 Nano模型,將計算成本壓縮了97%。
模型路由器的概念並非全新,但真正走入大眾視野,是在OpenAI發布GPT-5之後。該模型在ChatGPT內部根據用戶提示的複雜程度自動在不同模型之間切換,將路由邏輯內嵌於產品之中。此後,能夠跨多家供應商進行模型調度的路由器開始快速普及。
目前市場上的路由器形態多樣:既有獨立產品,也有雲計算服務商內置的功能模組,還有企業IT部門自行搭建的定製化方案。這些工具的共同目標是替代用戶手動選擇模型的操作,從而在降低成本的同时維持輸出品質。
Databricks推出的Unity AI Gateway便是其中一例。該公司CEO Ali Ghodsi表示,這款工具「非常受歡迎」,原因在於許多企業「正在以過快的速度耗盡預算」。Databricks在向客戶推出該產品之前,已在內部使用了一段時間。
路由器賽道正在吸引不同規模的參與者。據The Information此前報導,今年4月,提供路由技術的初創公司OpenRouter完成了1.2億美元新一輪融資,資本市場對這一方向的熱情可見一斑。
OpenRouter的「自動路由器」根據用戶對成本與品質的偏好(在0至10的刻度上自行設定)來決定調用哪個模型。數據顯示,該路由器約三分之一的時間會選擇谷歌相對廉價的Gemini 2.5 Flash Lite,而調用OpenAI更強大的GPT-5.5的比例僅約10%。OpenRouter的自動路由器底層由初創公司Not Diamond提供支持,後者專注於為AI編程智能體開發路由系統。
日本AI實驗室Sakana AI近期發布了一套基於路由器的多模型協同系統。該系統在測試中將數學問題主要分配給OpenAI的GPT-5.5,將科學問題分配給谷歌的Gemini,理由是系統判斷這兩個模型在各自領域優於其他選項。Sakana AI稱,該系統整體表現在編程、工程、科學任務和推理等基準測試上與Anthropic的Fable 5和Mythos Preview模型「並駕齊驅」。
AI編程應用Cognition本週也發布了新路由器,利用其內部基準測試識別不同智能體的相對優勢,並引入一個「sidekick」智能體處理較簡單的任務。Cognition表示,該路由器在某編程基準測試上達到了Fable 5的得分水平,成本卻低了35%。
並非所有企業都需要購買專業路由產品。開發者可以使用Claude Code等AI編程智能體自行搭建路由器,甚至直接讓一個AI模型來決定哪個模型最適合處理某個特定查詢。
Arcee AI負責AI智能體工作的Hunter Bown表示,他習慣使用DeepSeek V4 Flash來進行模型選擇,原因是其成本低廉。他的做法是向DeepSeek提供一份模型列表,讓其判斷哪個模型最適合處理當前提示。
不過,這類「快速搭建」方案也有其局限性。路由器提供商Martian的創始人Shriyash Upadhyay指出,更複雜的路由器有時會展示出亮眼的基準測試成績,但實際表現未必與之相符。他還提到,即便是更精密的路由器,僅憑用戶的第一條提示來預測最佳模型也頗具難度。
Upadhyay表示,模型迭代速度快、能力差異持續變化,使得路由決策愈發複雜。「各家公司沒有關於所有不同任務的無限數據,因此你必須真正深入模型內部,弄清楚這些模型擅長什麼。」為此,Martian在做路由決策時,不僅參考模型的輸出結果,還會考量構成這些模型的內部計算過程。
企業對AI成本的焦慮並非短期現象。隨著員工對高級AI模型的使用量(即「tokenmaxxing」現象)持續增加,管理層對AI支出的審視也在加強。這一背景為模型路由器提供了持續的需求驅動力。
Palantir的Evolve工具在路由功能之外,還能根據所選模型自動調整提示內容,並防止請求被重複發送給模型——後者是導致超額收費的常見原因之一。McCarthy Building的案例表明,透過優化提示結構,企業可以在使用前沿模型時消耗更少的token,同時獲得相同的輸出結果。
對於投資者而言,模型路由器賽道的升溫意味著:一方面,OpenRouter等專注路由技術的初創公司正在獲得資本青睞;另一方面,Databricks、Palantir等將路由功能整合進企業AI平台的公司,也在以此強化其產品競爭力。隨著AI基礎設施支出持續擴張,幫助企業控制這一支出的工具層,正在成為不可忽視的新興市場。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
480.22萬 熱度
106.08萬 熱度
21.88萬 熱度
1.52億 熱度
140.92萬 熱度
當AI帳單失控,模型路由器成為企業降本新寵
隨著企業AI使用成本持續攀升,一類名為「模型路由器」的技術正迅速從邊緣工具走向主流。這類系統能夠根據任務複雜程度自動調配最合適的AI模型,在不顯著犧牲品質的前提下大幅壓縮開支,正在吸引從初創公司到大型企業的廣泛關注。
模型路由器的核心邏輯在於:並非所有任務都需要最昂貴的前沿模型。總結郵件、檢索文檔等基礎工作完全可以交由開源模型或舊版專有模型處理,成本僅為頂級模型的一小部分。Snowflake和Palo Alto Networks等企業已向The Information證實,透過為特定任務替換更廉價的模型,實現了可觀的成本節約。
這一趨勢正在催生真實的商業回報。建築公司McCarthy Building表示,透過Palantir的路由工具Evolve,其當季AI token使用量較去年同期減少了60%。Palantir自身也揭露,在一個具體案例中,該工具透過將任務從OpenAI的GPT-5.1切換至更小的GPT-5.4 Nano模型,將計算成本壓縮了97%。
從手動選模型到自動路由:一個行業轉折點
模型路由器的概念並非全新,但真正走入大眾視野,是在OpenAI發布GPT-5之後。該模型在ChatGPT內部根據用戶提示的複雜程度自動在不同模型之間切換,將路由邏輯內嵌於產品之中。此後,能夠跨多家供應商進行模型調度的路由器開始快速普及。
目前市場上的路由器形態多樣:既有獨立產品,也有雲計算服務商內置的功能模組,還有企業IT部門自行搭建的定製化方案。這些工具的共同目標是替代用戶手動選擇模型的操作,從而在降低成本的同时維持輸出品質。
Databricks推出的Unity AI Gateway便是其中一例。該公司CEO Ali Ghodsi表示,這款工具「非常受歡迎」,原因在於許多企業「正在以過快的速度耗盡預算」。Databricks在向客戶推出該產品之前,已在內部使用了一段時間。
從初創公司到科技巨頭全面入局
路由器賽道正在吸引不同規模的參與者。據The Information此前報導,今年4月,提供路由技術的初創公司OpenRouter完成了1.2億美元新一輪融資,資本市場對這一方向的熱情可見一斑。
OpenRouter的「自動路由器」根據用戶對成本與品質的偏好(在0至10的刻度上自行設定)來決定調用哪個模型。數據顯示,該路由器約三分之一的時間會選擇谷歌相對廉價的Gemini 2.5 Flash Lite,而調用OpenAI更強大的GPT-5.5的比例僅約10%。OpenRouter的自動路由器底層由初創公司Not Diamond提供支持,後者專注於為AI編程智能體開發路由系統。
日本AI實驗室Sakana AI近期發布了一套基於路由器的多模型協同系統。該系統在測試中將數學問題主要分配給OpenAI的GPT-5.5,將科學問題分配給谷歌的Gemini,理由是系統判斷這兩個模型在各自領域優於其他選項。Sakana AI稱,該系統整體表現在編程、工程、科學任務和推理等基準測試上與Anthropic的Fable 5和Mythos Preview模型「並駕齊驅」。
AI編程應用Cognition本週也發布了新路由器,利用其內部基準測試識別不同智能體的相對優勢,並引入一個「sidekick」智能體處理較簡單的任務。Cognition表示,該路由器在某編程基準測試上達到了Fable 5的得分水平,成本卻低了35%。
DIY路由,低成本方案同樣奏效
並非所有企業都需要購買專業路由產品。開發者可以使用Claude Code等AI編程智能體自行搭建路由器,甚至直接讓一個AI模型來決定哪個模型最適合處理某個特定查詢。
Arcee AI負責AI智能體工作的Hunter Bown表示,他習慣使用DeepSeek V4 Flash來進行模型選擇,原因是其成本低廉。他的做法是向DeepSeek提供一份模型列表,讓其判斷哪個模型最適合處理當前提示。
不過,這類「快速搭建」方案也有其局限性。路由器提供商Martian的創始人Shriyash Upadhyay指出,更複雜的路由器有時會展示出亮眼的基準測試成績,但實際表現未必與之相符。他還提到,即便是更精密的路由器,僅憑用戶的第一條提示來預測最佳模型也頗具難度。
Upadhyay表示,模型迭代速度快、能力差異持續變化,使得路由決策愈發複雜。「各家公司沒有關於所有不同任務的無限數據,因此你必須真正深入模型內部,弄清楚這些模型擅長什麼。」為此,Martian在做路由決策時,不僅參考模型的輸出結果,還會考量構成這些模型的內部計算過程。
成本壓力持續,路由器需求料將擴大
企業對AI成本的焦慮並非短期現象。隨著員工對高級AI模型的使用量(即「tokenmaxxing」現象)持續增加,管理層對AI支出的審視也在加強。這一背景為模型路由器提供了持續的需求驅動力。
Palantir的Evolve工具在路由功能之外,還能根據所選模型自動調整提示內容,並防止請求被重複發送給模型——後者是導致超額收費的常見原因之一。McCarthy Building的案例表明,透過優化提示結構,企業可以在使用前沿模型時消耗更少的token,同時獲得相同的輸出結果。
對於投資者而言,模型路由器賽道的升溫意味著:一方面,OpenRouter等專注路由技術的初創公司正在獲得資本青睞;另一方面,Databricks、Palantir等將路由功能整合進企業AI平台的公司,也在以此強化其產品競爭力。隨著AI基礎設施支出持續擴張,幫助企業控制這一支出的工具層,正在成為不可忽視的新興市場。
風險提示及免責條款