他本來是去聊 Palantir 和輝達的新合作的，但話頭很快轉向了 OpenAI 和 Anthropic 的 token 收費模式。他說 CEO 們私下跟自己抱怨，現在企業的 AI 採用是「為不創造任何價值的 token 買單，還得把自己的數據交出去」。他甚至把越來越貴的模型帳單，稱為壓在企業身上的財富稅。

過去兩年，大家討論的是誰敢花、誰花得快、誰能先把資料中心堆起來。現在問題慢慢變了。機器買回來以後，誰能把它們一直跑滿。

Meta 的說法還沒有落地成正式業務。公開報導裡，它內部有一個叫 Meta Compute 的方向，可能賣原始算力，也可能像亞馬遜 Bedrock 那樣，把不同模型放在自己的基礎設施上賣給開發者。祖克柏此前在股東會上講過，外部公司幾乎每週都來問，能不能買他們的 API 服務，或者買一部分 compute，而且願意付高於 Meta 成本的價格。

他當時也補了一句。他們還沒有這麼做，因為 Meta 覺得自己還用得上這些算力。

如果用得上，出租是選擇題。如果用不上，出租就是資產負債表的止疼藥。

最難判斷的地方也在這裡。Meta 可能只是在建設節奏裡騰出一段窗口，把暫時空出來的資源拿出去賣。它也可能是在告訴投資者，千億美元級別的 AI 支出不能一直靠遠方的 superintelligence 支撐，必須先找到一條更近的收入線。

這兩種說法都能成立。

需求沒有消失，只是開始挑人

Capex 是 AI 敘事的核心，沒有之一，和 21 年的放水一樣，Capex 的預期是一直增長，水一直放，市場炒的所有分支才會一起漲。一看到 Meta 準備賣算力，很多人第一反應是，AI capex 要塌了。大公司終於承認買多了，半導體的盛宴該散了。

這樣說太省事。

公開數據還不支持這麼乾脆的結論。AWS 一季度收入漲了 28%，到了 376 億美元，是這幾年少見的快增長。Google Cloud 一季度漲得更猛，收入到了 200 億美元。微軟 Azure 也還在 40% 左右的速度上跑。

亞馬遜還在說今年資本開支可能到 2000 億美元，Alphabet 把 2026 年資本開支指引抬到 1800 億到 1900 億美元，Meta 自己也把全年資本開支抬到 1250 億到 1450 億美元。

這些數字不像一場需求崩塌。

更像一場分流。

雲廠商的處境和模型廠商不一樣。雲廠商賣的是路。只要路上有人跑，無論車是誰造的，它都能收錢。OpenAI、Anthropic、企業客戶、政府客戶、創業公司，最後都要落在某一片資料中心、某一種晶片、某一條網路和某一個電力合同上。

所以三大雲可以繼續硬。

AWS 甚至在 6 月底提高了一個 AI 雲服務的價格，是給客戶提前鎖 GPU 的服務，AWS 把這個服務 7 月開始的價格又上調了大約 20%。1 月它已經調過一次，大約 15%。這不是需求疲軟時會出現的動作。

稀缺的時候，賣方漲價。

但模型公司不一定都能這麼舒服。

模型公司的資產要更挑剔。算力不是放在那裡就能產生收入。它要被更聰明的模型、更高頻的用戶、更貴的企業工作流不斷填滿。只有當模型足夠好，用戶才願意忍受排隊、限額、漲價和越來越複雜的訂閱層級。

這也是為什麼 Anthropic 會被市場看成另一類公司。它不是因為便宜，而是因為用戶願意把昂貴任務交給它。寫程式碼、改系統、跑長任務、接企業工作流，這些任務一旦真的進入生產環境，消耗的 token 會比閒聊大得多。

強模型的麻煩是機器不夠。

弱模型的麻煩是機器沒人心疼。

這兩個麻煩都叫算力，但它們不是同一種東西。

xAI 那條線也有同樣的味道。Grok 沒有像最強模型那樣形成清晰的企業心智，馬斯克體系裡的一部分算力卻可以流向 Anthropic。這個動作比任何口號都冷靜。機器不創始人，它只認誰能把它跑滿。

Google 與 Meta 的關係也說明事情沒那麼簡單。6 月有消息說，Google 限制了 Meta 對 Gemini 的使用，原因是 Meta 想買的算力超過了 Google 能提供的範圍，甚至影響了 Meta 內部一些 AI 項目。一個公司一邊考慮賣算力，一邊又在某些任務上買不到足夠的頭部模型能力。

這不是傳統意義上的過剩。

這是錯配。因為帳單開始變得刺眼。

雲廠商可以繼續漲價，因為它們賣的是確定性。客戶要的是一段時間內一定能拿到的 GPU，一片穩定的資料中心，一套不會半夜斷掉的基礎設施。

但企業客戶拿到算力以後，問題沒有結束。

它們還要把這張帳單交給 CFO。CFO 不會問你用了多少 token，他會問這些 token 替公司省了多少錢，多賺了多少錢，少犯了多少錯。

到了企業那裡，token 變成了電表

這就回到了開頭 Karp 那場採訪。

他把很多 AI 公司賣給企業的東西說過度銷售。上節目前一天，Palantir 還在 X 上發了一份九點聲明，講所謂 AI 主權，其中專門點了 tokenmaxxing 這種模式。這個詞很難翻，直譯出來難聽，但意思並不複雜，就是把消耗 token 當成進步，把燒錢當成使用，把帳單當成生產力。

Karp 把 OpenAI、Anthropic 這類前沿實驗室推到了桌面上。他的意思不是企業不該用最強模型，而是企業不該把自己的數據、流程和業務判斷都交出去，然後再按消耗量付一張越來越大的帳單。

Palantir 想賣的是另一種東西。不是一個通用聊天框，不是單一 API，而是把數據、審批、權限、運營規則和 AI 放進同一套業務系統裡。客戶花錢買的不是「用了多少次 AI」，而是某條生產線、某套風控流程、某個政府任務有沒有真的被改造。

企業裡真正管錢的人已經開始醒了。

UBS 最近和企業 IT 高管聊下來，一個方向很清楚。很多企業不是不用 AI 了，而是在給 AI 花錢裝剎車。大約 60% 的受訪企業在壓 token 開支、加使用護欄，尤其是那些已經過了試用期、開始把 AI 放進日常流程的公司。

這也是一個很有意思的反轉。

AI 從玩具變成工具以後，花錢反而更難了。玩具階段，老闆願意給預算，因為大家都怕錯過。工具階段，CFO 會問它替誰省了工時，替誰多賣了貨，替誰降低了風險。

在這張表上，token 不像收入。

它更像電表。

你當然可以說，電表轉得快說明工廠在開工。也可以說，電表轉得太快而產量沒上去，說明這台機器有問題。

AI agent 把這個問題放大了。OpenAI 和幾所大學的一篇 Codex 研究裡有一組數據很嚇人。2026 年上半年，Codex 活躍用戶增長超過五倍；OpenAI 內部一些崗位的輸出 token 也暴漲，法律崗位的中位數月輸出 token 比 2025 年 11 月高 13 倍，研究崗位高 50 多倍。

另一篇研究把事情說得更硬。agentic coding 任務消耗的 token，可以比普通程式碼聊天和程式碼推理高 1000 倍。同一個任務，不同運行之間的 token 消耗可能相差 30 倍。

這才是今天算力緊缺的底層。

不是大家多問了幾句聊天機器人。

是軟體開始變成一群會反覆讀文件、跑命令、改程式碼、失敗、重來、再失敗、再重來的小型工人。它們沒有午飯時間，但每一步都在吃 token。

當 token 變成電表，誰擁有發電廠，誰就有權力。可誰把電浪費掉，誰也會先被審問。

帳單一變厚，便宜模型就有了位置

CFO 一旦開始看這張電表，下一步幾乎不用人教。

他會問，哪些任務必須用最強模型，哪些任務只需要夠用的模型。

這時候，GLM、Kimi、DeepSeek、Qwen 這些開源模型就不再只是技術新聞。它們變成了企業採購桌上的砍價工具。

連矽谷頂級風投 a16z 的馬克·安德森都說，很多 AI 從業者已經把智譜 GLM-5.2 看成第一批能在多數任務中匹配、甚至超過美國頭部公開模型的中國模型。這個判斷未必是最終裁判，但它讓企業多了一句話。

Coinbase 給了更硬的例子。Brian Armstrong 說，公司把默認 AI 模型切到 GLM 5.2、Kimi 2.7 這類開源模型，再配合模型路由、快取和精簡上下文，Token 使用量還在指數級增長，AI 支出卻砍掉了接近一半。

這句話的殺傷力在於，企業第一次可以把模型能力拆開採購。

最難的任務，繼續交給最貴的模型。普通摘要、客服、資訊抽取、模板化程式碼、內部知識庫問答，交給便宜模型和本地部署。

開源模型未必要贏下全部戰場。

它只要讓採購部門相信，不是每一度電都要按豪宅電價付錢。

到了這裡，Meta 賣算力就不再是一條孤立新聞。

它和 Palantir 罵 token、Coinbase 切開源模型說的是同一件事：AI 的支出鏈條開始被拆開。上游賣確定性，中游賣結果，下游壓單價。每一層都還在增長，但每一層都開始被問，錢到底花得值不值。

最難的不是買機器，是讓機器一直有活幹

過去兩年，AI 行業最容易講的故事，是資源不夠。

GPU 不夠，電不夠，資料中心不夠，工程師不夠，能把模型跑起來的雲也不夠。這個故事太順了。只要東西不夠，所有人都會本能地往前衝。先佔位置，先簽電力，先買晶片，先把機器架起來。

搶資源的時候，人不太會算細帳。

因為慢一步的代價看起來更大。

但 Meta 這條消息把另一個問題推了出來。機器買回來以後，不會因為它貴，就自動變成好生意。它要每天有活幹，要有客戶願意付錢，要有模型把它跑滿，要有應用把成本轉成收入。

這就是利用率。

利用率這個詞聽上去很冷，其實很殘酷。它問的不是你有沒有未來，而是你今天這台機器有沒有開工。它不關心你在發布會上怎麼說，也不關心你買的是不是最貴的 GPU。它只看一件事：這筆錢有沒有變成持續的現金流。

雲廠商回答這個問題相對容易。它們本來就賣基礎設施。AWS、Google Cloud、Azure 賣的是路、電和機房。客戶要訓練模型，要跑推理，要託管應用，最後都要落在某一片雲上。

所以它們還可以硬。

強模型公司也有自己的回答。如果模型足夠強，用戶願意排隊，企業願意接入，開發者願意圍著它改工作流，那麼算力不是庫存，是瓶頸。機器越多，它越能跑得開。

最難的是中間那一層。

它們有機器，有故事，有模型團隊，也有很大的預算。可是模型沒有跑到最前面，產品沒有變成日常習慣，開發者也不願意為它改工作流。對這一類公司來說，算力從武器變成庫存，只需要一次模型發布失敗，或者一次用戶遷移。

庫存不一定沒用。

但庫存必須降價，必須出租，必須找新用途。

這就是 Meta 賣算力刺眼的地方。它不證明 Meta 失敗，也不證明 AI 需求消失。它只是讓市場第一次看見，AI 基礎設施也會遇到普通工廠遇到的問題。

工廠建好了，訂單在哪裡。

算力沒有消失，只是開始分層

所以這件事最好的理解，不是「算力過剩」。

這個詞太粗。

更準確的說法是，算力開始分層。

最上面那一層，仍然緊。最強模型、最好的雲、最穩定的 GPU 集群，還是有人搶。AWS 的服務能漲價，就是因為確定性本身有價格。客戶不是只買 GPU，它買的是某一天、某一小時、某一批機器一定能用。

中間那一層，開始尷尬。它也許不差，但不夠稀缺。它能跑模型，能做推理，也能賣給外部客戶。只是客戶會比較，會砍價，會問為什麼不用更便宜的模型，為什麼不用別人的雲，為什麼這批機器一定值這個價格。

最下面那一層，會被開源模型和成本優化一點點擠壓。企業不會為了普通任務永遠調用最貴模型。它們會做路由，會做快取，會壓上下文，會把模型拆成不同檔位。

需求長大了。

小孩子花錢不看帳單，成年人會看。AI 進入企業以後，也會經歷這個過程。試點階段，大家害怕錯過；規模化階段，大家開始算帳。

算帳以後，產業鏈就不會再像早期那樣整齊。

有人繼續漲價，因為他賣的是不可替代的確定性。有人改賣結果，因為客戶不想為消耗本身付錢。有人被迫降價，因為夠用的替代品出現了。有人把機器租出去，因為機器閒著比低價出租更難看。

這幾件事同時發生，就會讓行業看起來矛盾。

一邊是算力緊缺。

一邊是算力出租。

一邊是 token 消耗暴漲。

一邊是企業壓低 AI 支出。

一邊是頭部模型越來越強。

一邊是開源模型越來越便宜。

它們並不衝突。它們只是說明，AI 已經從一個總量故事，進入一個結構故事。

舊鐵路的故事還會再講一遍

十九世紀的鐵路泡沫裡，鐵路不是假的。

鐵軌鋪下去，貨物真的會走，城市真的會長，時間真的會被縮短。很多後來最有價值的商業網路，確實長在那些鐵軌旁邊。

可這不妨礙當年很多修鐵路的人虧錢。

他們輸的不是方向。他們輸在修早了，修多了，修到了沒有客貨流的地方，或者借了太貴的錢去修一條太慢才能回本的路。

網際網路泡沫裡的光纖也是一樣。光纖沒有錯。後來整個世界都被它托起來。錯的是那一批帳本，它們把未來幾十年的需求一次性塞進了幾年的資本開支裡。

AI 資料中心可能也會留下很多有用的東西。GPU 會折舊，電力合同會續簽，資料中心會換設備，軟體會越來越會吃算力。今天看起來誇張的 token 消耗，幾年後也許會像高清影片流量一樣普通。

但資產有自己的脾氣。

它不關心你信不信未來。它只關心每天有沒有人來用。

Meta 賣算力的訊號，就卡在這個地方。

它不是 AI 的終點。也不是半導體的終點。它更像資本開支敘事走到中段時，第一次有人把門打開，讓外面的人看見倉庫裡有多少機器。

有些機器會被頭部模型吃掉。

有些機器會被雲客戶租走。

有些機器會在價格戰裡變便宜。

還有一些機器，會靜靜地等一個還沒出現的應用。

過去兩年，市場願意相信所有機器最後都會等到自己的命運。現在它開始問，誰先等到，誰等不到，誰等到了也賺不到足夠的錢。

這個問題一出來，AI 的故事就變了。

它不再只屬於那些買機器最快的人。

它屬於那些能讓機器一直轉下去的人。

原文連結

點擊了解律動 BlockBeats 在招崗位

歡迎加入律動 BlockBeats 官方社群：

Telegram 訂閱群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方帳號：https://twitter.com/BlockBeatsAsia

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
Gate股票轉倉功能上線
53.35萬熱度
#
Circle股價重挫17%
416.41萬熱度
#
預測世界盃葡萄牙VS克羅地亞
16.33萬熱度
#
GateCard上線積分體系
12萬熱度
#
非農數據倒計時
92.14萬熱度

已置頂

Meta賣算力、Palantir罵街、智譜成矽谷頂流，AI Capex的故事要換一個講法

需求沒有消失，只是開始挑人

到了企業那裡，token 變成了電表

帳單一變厚，便宜模型就有了位置

最難的不是買機器，是讓機器一直有活幹

算力沒有消失，只是開始分層

舊鐵路的故事還會再講一遍

熱門話題

Gate股票轉倉功能上線

Circle股價重挫17%

預測世界盃葡萄牙VS克羅地亞

GateCard上線積分體系

非農數據倒計時

已置頂