模型路由器的核心邏輯在於：並非所有任務都需要最昂貴的前沿模型。總結郵件、檢索文檔等基礎工作完全可以交由開源模型或舊版專有模型處理，成本僅為頂級模型的一小部分。Snowflake和Palo Alto Networks等企業已向The Information證實，透過為特定任務替換更廉價的模型，實現了可觀的成本節約。

這一趨勢正在催生真實的商業回報。建築公司McCarthy Building表示，透過Palantir的路由工具Evolve，其當季AI token使用量較去年同期減少了60%。Palantir自身也揭露，在一個具體案例中，該工具透過將任務從OpenAI的GPT-5.1切換至更小的GPT-5.4 Nano模型，將計算成本壓縮了97%。

從手動選模型到自動路由：一個行業轉折點

模型路由器的概念並非全新，但真正走入大眾視野，是在OpenAI發布GPT-5之後。該模型在ChatGPT內部根據用戶提示的複雜程度自動在不同模型之間切換，將路由邏輯內嵌於產品之中。此後，能夠跨多家供應商進行模型調度的路由器開始快速普及。

目前市場上的路由器形態多樣：既有獨立產品，也有雲計算服務商內置的功能模組，還有企業IT部門自行搭建的定製化方案。這些工具的共同目標是替代用戶手動選擇模型的操作，從而在降低成本的同时維持輸出品質。

Databricks推出的Unity AI Gateway便是其中一例。該公司CEO Ali Ghodsi表示，這款工具「非常受歡迎」，原因在於許多企業「正在以過快的速度耗盡預算」。Databricks在向客戶推出該產品之前，已在內部使用了一段時間。

從初創公司到科技巨頭全面入局

路由器賽道正在吸引不同規模的參與者。據The Information此前報導，今年4月，提供路由技術的初創公司OpenRouter完成了1.2億美元新一輪融資，資本市場對這一方向的熱情可見一斑。

OpenRouter的「自動路由器」根據用戶對成本與品質的偏好（在0至10的刻度上自行設定）來決定調用哪個模型。數據顯示，該路由器約三分之一的時間會選擇谷歌相對廉價的Gemini 2.5 Flash Lite，而調用OpenAI更強大的GPT-5.5的比例僅約10%。OpenRouter的自動路由器底層由初創公司Not Diamond提供支持，後者專注於為AI編程智能體開發路由系統。

日本AI實驗室Sakana AI近期發布了一套基於路由器的多模型協同系統。該系統在測試中將數學問題主要分配給OpenAI的GPT-5.5，將科學問題分配給谷歌的Gemini，理由是系統判斷這兩個模型在各自領域優於其他選項。Sakana AI稱，該系統整體表現在編程、工程、科學任務和推理等基準測試上與Anthropic的Fable 5和Mythos Preview模型「並駕齊驅」。

AI編程應用Cognition本週也發布了新路由器，利用其內部基準測試識別不同智能體的相對優勢，並引入一個「sidekick」智能體處理較簡單的任務。Cognition表示，該路由器在某編程基準測試上達到了Fable 5的得分水平，成本卻低了35%。

DIY路由，低成本方案同樣奏效

並非所有企業都需要購買專業路由產品。開發者可以使用Claude Code等AI編程智能體自行搭建路由器，甚至直接讓一個AI模型來決定哪個模型最適合處理某個特定查詢。

Arcee AI負責AI智能體工作的Hunter Bown表示，他習慣使用DeepSeek V4 Flash來進行模型選擇，原因是其成本低廉。他的做法是向DeepSeek提供一份模型列表，讓其判斷哪個模型最適合處理當前提示。

不過，這類「快速搭建」方案也有其局限性。路由器提供商Martian的創始人Shriyash Upadhyay指出，更複雜的路由器有時會展示出亮眼的基準測試成績，但實際表現未必與之相符。他還提到，即便是更精密的路由器，僅憑用戶的第一條提示來預測最佳模型也頗具難度。

Upadhyay表示，模型迭代速度快、能力差異持續變化，使得路由決策愈發複雜。「各家公司沒有關於所有不同任務的無限數據，因此你必須真正深入模型內部，弄清楚這些模型擅長什麼。」為此，Martian在做路由決策時，不僅參考模型的輸出結果，還會考量構成這些模型的內部計算過程。

成本壓力持續，路由器需求料將擴大

企業對AI成本的焦慮並非短期現象。隨著員工對高級AI模型的使用量（即「tokenmaxxing」現象）持續增加，管理層對AI支出的審視也在加強。這一背景為模型路由器提供了持續的需求驅動力。

Palantir的Evolve工具在路由功能之外，還能根據所選模型自動調整提示內容，並防止請求被重複發送給模型——後者是導致超額收費的常見原因之一。McCarthy Building的案例表明，透過優化提示結構，企業可以在使用前沿模型時消耗更少的token，同時獲得相同的輸出結果。

對於投資者而言，模型路由器賽道的升溫意味著：一方面，OpenRouter等專注路由技術的初創公司正在獲得資本青睞；另一方面，Databricks、Palantir等將路由功能整合進企業AI平台的公司，也在以此強化其產品競爭力。隨著AI基礎設施支出持續擴張，幫助企業控制這一支出的工具層，正在成為不可忽視的新興市場。

風險提示及免責條款

        市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
gStocks代幣化股票上線
480.22萬熱度
#
非農爆冷打壓加息預期
106.08萬熱度
#
預測世界盃巴西VS挪威
21.88萬熱度
#
ETH突破1700
1.52億熱度
#
Meta賣算力引發存儲股大跌
140.92萬熱度

已置頂

當AI帳單失控，模型路由器成為企業降本新寵

從手動選模型到自動路由：一個行業轉折點

從初創公司到科技巨頭全面入局

DIY路由，低成本方案同樣奏效

成本壓力持續，路由器需求料將擴大

熱門話題

gStocks代幣化股票上線

非農爆冷打壓加息預期

預測世界盃巴西VS挪威

ETH突破1700

Meta賣算力引發存儲股大跌

已置頂