今年上半年，「Token最大化」（Tokenmaxxing）成為企業AI圈的流行詞。Meta、Salesforce等公司主動鼓勵員工盡可能多地消耗AI Token以提升生產力。Meta內部甚至出現了一個名為「克勞德經濟學」（Claudeconomics）的排行榜，追蹤公司前250名重度用戶。數據顯示，Meta員工在30天內消耗了超過60萬億個Token，單個最高消耗用戶約達2800億個Token。員工們為了競逐「Token傳奇」「緩存巫師」等稱號，讓AI代理花數小時做無意義的研究來「燒Token」。

隨後，Uber因在四個月內燒光Claude Code和Codex全年預算登上頭條，隨即對員工實施每月1500美元的使用上限，超出部分需逐案審批。

這些事件引發廣泛關注。但SemiAnalysis團隊在Databricks AI峰會上進行實地調研，並通過Slack、電話與超過50家企業客戶深度交流後，得出了與媒體敘事截然不同的結論。

該機構認為，媒體的報導嚴重誇大了問題的普遍性。Meta和Uber的極端案例，根源是激勵機制失當和內部管理鬆弛，而非企業AI投入整體失控。

頭條故事被誇大，真實數據更溫和

媒體報導可能誇大了企業AI預算危機。

關鍵數據支撐這一判斷。SemiAnalysis援引Ramp的消費數據顯示，前1%的頭部客戶每位員工年均AI支出約9萬美元，前10%約為7300美元，而Ramp客戶的中位數僅為136美元。Ramp客戶整體技術應用水平已遠高於普通企業，但《財富》500強媒體類客戶的人均AI支出仍遠低於100美元。

即便是「燒Token大戶」Meta，按標價計算每年每位員工花費接近5萬美元，據SemiAnalysis估算也僅佔Anthropic客戶收入的3%至5%。

Anthropic自身文檔也印證了這一點：Claude Code開發者月均支出僅150至250美元，僅**10%**的用戶日均花費超過30美元。

SemiAnalysis認為：「媒體的誇大報導並不屬實——企業仍在持續投入，新的需求場景和垂直領域帶來的Token消耗，正推動著AI列車以迅猛的速度繼續前行。」

這意味著企業AI採用仍處在不均勻擴散階段。不是所有員工都在高頻調用大模型。很多公司只是少數團隊、少數崗位先跑起來。

預算管控成新常態，但標準五花八門

超過50家受訪企業中，大多數已對AI使用設置硬性上限。但各公司的標準差異極大，並無行業共識。

低端案例：

美國排名前三的航空航天與國防製造商：每人每月250美元上限，部分重度用戶首月四天即耗盡額度
全球最大製藥公司之一：每人每月500美元，特殊情況可申請1000美元

高端案例：

Workday、Stripe：員工月度預算約2000美元
上市網路安全公司：初級員工每月800美元，高級員工1600至4000美元，數據科學家獲最高額度
大型旅遊科技公司（1500名員工中800名工程師，年AI支出接近1000萬美元）：默認每人每月200美元，根據職位可增至數萬美元

預算設定邏輯也各有不同。一家美國三大航空公司之一的做法最為特殊：Token分配直接與具體項目及預期營收掛鉤。例如，一個預期營收1000萬美元的項目，財務團隊批准100萬美元總支出預算，團隊再自行決定其中多少比例用於Token——AI成本被納入項目財務模型，而非單獨的IT預算。

員工的「省Token」生存法則

預算壓力倒逼出了一套實用的Token節約策略。

最典型的是「Copilot套利」：微軟365企業版訂閱用戶可免費無限使用標準Copilot聊天機器人，且該使用量不計入月度AI預算。一家大型荷蘭消費品與健康科技公司明確表示，員工會先用Copilot草擬和整合創意，再調用Claude或Codex處理最終任務，以此節約計量Token。

模型降級也是常見手段。那家全球旅遊科技公司已將所有員工的Claude默認模型從Opus切換為Sonnet，Opus仍可使用但需主動選擇。那家航空航天與國防製造商則直接「關閉」了Opus 4.8和快速模式。

對此，SemiAnalysis團隊直接點評了管理層的邏輯：「管理層認為給員工更大的Token預算會促使他們自動化那些根本不該自動化的任務，比如撰寫郵件。我們認為這種反自動化觀點過於天真。」

便宜Token需求仍在增長，TaaS/API端點市場沒有冷下來

預算管理不等於減少調用。企業更關心的是單位成本。

便宜Token的需求仍然強。前沿模型和開源模型的Token-as-a-Service/API端點市場都在增長。AWS Bedrock被納入測算後，SemiAnalysis對AWS本季度整體增長率的估計高於市場預期。

TaaS供應商也在擴張。Together、Fireworks、Baseten等公司合計ARR已超過40億美元。

這說明企業預算壓力會改變採購結構。能用便宜模型解決的問題，就不會一直調用最貴模型。默認模型被降級，不代表AI使用減少，而是成本曲線被重新優化。

編碼仍是最強需求，AI列車沒有因為預算上限而減速

編碼場景仍是當前AI收入最大的驅動力，OpenAI和Anthropic逾70%的ARR來自這一方向。Anthropic B2B佔比超90%（OpenAI約60%），決定了其收入結構對企業端的依賴更深，也更穩定。

下一波增長被認為將來自網路安全和白領知識工作。隨著Cowork、CoPilot、Codex及Computer類產品進一步滲透企業，編碼市場拉動AI實驗室ARR增長的路徑，會在更廣泛的場景中重演。

當前大多數財富500強企業的人均AI支出仍遠低於2000美元/年，主要集中在工程和數據科學部門。這意味著AI在企業中的普及還處於早期階段，增長空間並未消失，只是換了形態——從「隨意燒錢」變成了「有預算地持續投入」。

AI真正的ROI：效率提升，但產出預期也在同步上升

在受訪企業中，AI帶來的效率提升案例真實存在，且效果顯著。

亞馬遜招聘部門：從初步篩選到團隊安置的流程，過去需要6至9個月，藉助AI工具後縮短至3至4個月
一家為85%的《財富》500強提供數據分析服務的公司：過去需要一週完成的工作，現在只需幾小時

但效率提升的另一面是：產出預期同步上升。一位法律數據與風險解決方案公司的員工坦言，原本一週的工作量被壓縮到幾小時，「但公司卻因此期待她完成更多工作，結果她比之前更忙碌了。」

SemiAnalysis指出，Uber、Meta等公司的Token超支事件，根本原因是激勵機制失當和監管鬆懈，而非缺乏高ROI的應用場景。亞馬遜儘管大規模裁員，但因AI工具帶來的效率提升，正在以更快速度招聘新員工——這是AI作為「人力槓桿」最清晰的註腳。

風險提示及免責條款

        市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

已置頂

Token狂歡退潮後的企業現實：預算管控成新常態，但AI列車未減速

頭條故事被誇大，真實數據更溫和

預算管控成新常態，但標準五花八門

員工的「省Token」生存法則

便宜Token需求仍在增長，TaaS/API端點市場沒有冷下來

編碼仍是最強需求，AI列車沒有因為預算上限而減速

AI真正的ROI：效率提升，但產出預期也在同步上升

熱門話題

Gate股票轉倉功能上線

Strategy擬回購股票

預測世界盃英格蘭VS剛果

特朗普披露持有超1億美元加密資產

Sharplink增持1萬枚ETH

已置頂