Token狂歡退潮後的企業現實:預算管控成新常態,但AI列車未減速

企業AI消費的「無限暢飲」時代正在收尾,但帳單管控並不等於踩煞車。

今年上半年,「Token最大化」(Tokenmaxxing)成為企業AI圈的流行詞。Meta、Salesforce等公司主動鼓勵員工盡可能多地消耗AI Token以提升生產力。Meta內部甚至出現了一個名為「克勞德經濟學」(Claudeconomics)的排行榜,追蹤公司前250名重度用戶。數據顯示,Meta員工在30天內消耗了超過60萬億個Token,單個最高消耗用戶約達2800億個Token。員工們為了競逐「Token傳奇」「緩存巫師」等稱號,讓AI代理花數小時做無意義的研究來「燒Token」。

隨後,Uber因在四個月內燒光Claude Code和Codex全年預算登上頭條,隨即對員工實施每月1500美元的使用上限,超出部分需逐案審批。

這些事件引發廣泛關注。但SemiAnalysis團隊在Databricks AI峰會上進行實地調研,並通過Slack、電話與超過50家企業客戶深度交流後,得出了與媒體敘事截然不同的結論。

該機構認為,媒體的報導嚴重誇大了問題的普遍性。Meta和Uber的極端案例,根源是激勵機制失當和內部管理鬆弛,而非企業AI投入整體失控。

頭條故事被誇大,真實數據更溫和

媒體報導可能誇大了企業AI預算危機。

關鍵數據支撐這一判斷。SemiAnalysis援引Ramp的消費數據顯示,前1%的頭部客戶每位員工年均AI支出約9萬美元,前10%約為7300美元,而Ramp客戶的中位數僅為136美元。Ramp客戶整體技術應用水平已遠高於普通企業,但《財富》500強媒體類客戶的人均AI支出仍遠低於100美元

即便是「燒Token大戶」Meta,按標價計算每年每位員工花費接近5萬美元,據SemiAnalysis估算也僅佔Anthropic客戶收入的3%至5%

Anthropic自身文檔也印證了這一點:Claude Code開發者月均支出僅150至250美元,僅**10%**的用戶日均花費超過30美元。

SemiAnalysis認為:「媒體的誇大報導並不屬實——企業仍在持續投入,新的需求場景和垂直領域帶來的Token消耗,正推動著AI列車以迅猛的速度繼續前行。」

這意味著企業AI採用仍處在不均勻擴散階段。不是所有員工都在高頻調用大模型。很多公司只是少數團隊、少數崗位先跑起來。

預算管控成新常態,但標準五花八門

超過50家受訪企業中,大多數已對AI使用設置硬性上限。但各公司的標準差異極大,並無行業共識。

低端案例:

  • 美國排名前三的航空航天與國防製造商:每人每月250美元上限,部分重度用戶首月四天即耗盡額度

  • 全球最大製藥公司之一:每人每月500美元,特殊情況可申請1000美元

高端案例:

  • Workday、Stripe:員工月度預算約2000美元

  • 上市網路安全公司:初級員工每月800美元,高級員工1600至4000美元,數據科學家獲最高額度

  • 大型旅遊科技公司(1500名員工中800名工程師,年AI支出接近1000萬美元):默認每人每月200美元,根據職位可增至數萬美元

預算設定邏輯也各有不同。一家美國三大航空公司之一的做法最為特殊:Token分配直接與具體項目及預期營收掛鉤。例如,一個預期營收1000萬美元的項目,財務團隊批准100萬美元總支出預算,團隊再自行決定其中多少比例用於Token——AI成本被納入項目財務模型,而非單獨的IT預算。

員工的「省Token」生存法則

預算壓力倒逼出了一套實用的Token節約策略。

最典型的是「Copilot套利」:微軟365企業版訂閱用戶可免費無限使用標準Copilot聊天機器人,且該使用量不計入月度AI預算。一家大型荷蘭消費品與健康科技公司明確表示,員工會先用Copilot草擬和整合創意,再調用Claude或Codex處理最終任務,以此節約計量Token。

模型降級也是常見手段。那家全球旅遊科技公司已將所有員工的Claude默認模型從Opus切換為Sonnet,Opus仍可使用但需主動選擇。那家航空航天與國防製造商則直接「關閉」了Opus 4.8和快速模式

對此,SemiAnalysis團隊直接點評了管理層的邏輯:「管理層認為給員工更大的Token預算會促使他們自動化那些根本不該自動化的任務,比如撰寫郵件。我們認為這種反自動化觀點過於天真。」

便宜Token需求仍在增長,TaaS/API端點市場沒有冷下來

預算管理不等於減少調用。企業更關心的是單位成本。

便宜Token的需求仍然強。前沿模型和開源模型的Token-as-a-Service/API端點市場都在增長。AWS Bedrock被納入測算後,SemiAnalysis對AWS本季度整體增長率的估計高於市場預期。

TaaS供應商也在擴張。Together、Fireworks、Baseten等公司合計ARR已超過40億美元。

這說明企業預算壓力會改變採購結構。能用便宜模型解決的問題,就不會一直調用最貴模型。默認模型被降級,不代表AI使用減少,而是成本曲線被重新優化。

編碼仍是最強需求,AI列車沒有因為預算上限而減速

編碼場景仍是當前AI收入最大的驅動力,OpenAI和Anthropic逾70%的ARR來自這一方向。Anthropic B2B佔比超90%(OpenAI約60%),決定了其收入結構對企業端的依賴更深,也更穩定。

下一波增長被認為將來自網路安全和白領知識工作。隨著Cowork、CoPilot、Codex及Computer類產品進一步滲透企業,編碼市場拉動AI實驗室ARR增長的路徑,會在更廣泛的場景中重演。

當前大多數財富500強企業的人均AI支出仍遠低於2000美元/年,主要集中在工程和數據科學部門。這意味著AI在企業中的普及還處於早期階段,增長空間並未消失,只是換了形態——從「隨意燒錢」變成了「有預算地持續投入」。

AI真正的ROI:效率提升,但產出預期也在同步上升

在受訪企業中,AI帶來的效率提升案例真實存在,且效果顯著。

  • 亞馬遜招聘部門:從初步篩選到團隊安置的流程,過去需要6至9個月,藉助AI工具後縮短至3至4個月

  • 一家為85%的《財富》500強提供數據分析服務的公司:過去需要一週完成的工作,現在只需幾小時

但效率提升的另一面是:產出預期同步上升。一位法律數據與風險解決方案公司的員工坦言,原本一週的工作量被壓縮到幾小時,「但公司卻因此期待她完成更多工作,結果她比之前更忙碌了。」

SemiAnalysis指出,Uber、Meta等公司的Token超支事件,根本原因是激勵機制失當和監管鬆懈,而非缺乏高ROI的應用場景。亞馬遜儘管大規模裁員,但因AI工具帶來的效率提升,正在以更快速度招聘新員工——這是AI作為「人力槓桿」最清晰的註腳。

風險提示及免責條款

        市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆