Meta 的說法還沒有落地成正式業務。公開報導裡,它內部有一個叫 Meta Compute 的方向,可能賣原始算力,也可能像亞馬遜 Bedrock 那樣,把不同模型放在自己的基礎設施上賣給開發者。祖克柏此前在股東會上講過,外部公司幾乎每週都來問,能不能買他們的 API 服務,或者買一部分 compute,而且願意付高於 Meta 成本的價格。
他當時也補了一句。他們還沒有這麼做,因為 Meta 覺得自己還用得上這些算力。
如果用得上,出租是選擇題。如果用不上,出租就是資產負債表的止疼藥。
最難判斷的地方也在這裡。Meta 可能只是在建設節奏裡騰出一段窗口,把暫時空出來的資源拿出去賣。它也可能是在告訴投資者,千億美元級別的 AI 支出不能一直靠遠方的 superintelligence 支撐,必須先找到一條更近的收入線。
這兩種說法都能成立。
需求沒有消失,只是開始挑人
Capex 是 AI 敘事的核心,沒有之一,和 21 年的放水一樣,Capex 的預期是一直增長,水一直放,市場炒的所有分支才會一起漲。一看到 Meta 準備賣算力,很多人第一反應是,AI capex 要塌了。大公司終於承認買多了,半導體的盛宴該散了。
Google 與 Meta 的關係也說明事情沒那麼簡單。6 月有消息說,Google 限制了 Meta 對 Gemini 的使用,原因是 Meta 想買的算力超過了 Google 能提供的範圍,甚至影響了 Meta 內部一些 AI 項目。一個公司一邊考慮賣算力,一邊又在某些任務上買不到足夠的頭部模型能力。
Meta賣算力、Palantir罵街、智譜成矽谷頂流,AI Capex的故事要換一個講法
AI 行情再次暴力回調,這次因為 Meta 說可能要把自己多出來的 AI 算力拿出去賣。
這個消息如果放在三年前,大概沒人會覺得奇怪。雲端運算本來就是一門把伺服器切碎再賣給別人的生意。亞馬遜、微軟、谷歌都這麼幹了很多年。CoreWeave、Nebius 這些新雲廠商,也在這條路上把輝達晶片變成融資抵押物,再把融資變成更多晶片。
可偏偏輪到 Meta,事情就變了味道。
Meta 過去不是這樣理解算力的。它買晶片、建資料中心、搶電力和土地,是為了自己的模型,為了廣告系統,為了推薦流,為了祖克柏嘴裡那個越來越近的 superintelligence。它不是雲廠商。它原來不靠把機器租給別人賺錢。
一家公司以前說,我需要盡可能多的機器,因為未來會吞掉它們。現在它說,如果這些機器暫時用不完,也可以賣給別人。
這不能直接說明算力過剩,但也不能輕輕放過去。
股市暴跌當天,Palantir CEO Alex Karp 在 CNBC 的採訪節目上,對著鏡頭罵了將近二十分鐘。
他本來是去聊 Palantir 和輝達的新合作的,但話頭很快轉向了 OpenAI 和 Anthropic 的 token 收費模式。他說 CEO 們私下跟自己抱怨,現在企業的 AI 採用是「為不創造任何價值的 token 買單,還得把自己的數據交出去」。他甚至把越來越貴的模型帳單,稱為壓在企業身上的財富稅。
過去兩年,大家討論的是誰敢花、誰花得快、誰能先把資料中心堆起來。現在問題慢慢變了。機器買回來以後,誰能把它們一直跑滿。
Meta 的說法還沒有落地成正式業務。公開報導裡,它內部有一個叫 Meta Compute 的方向,可能賣原始算力,也可能像亞馬遜 Bedrock 那樣,把不同模型放在自己的基礎設施上賣給開發者。祖克柏此前在股東會上講過,外部公司幾乎每週都來問,能不能買他們的 API 服務,或者買一部分 compute,而且願意付高於 Meta 成本的價格。
他當時也補了一句。他們還沒有這麼做,因為 Meta 覺得自己還用得上這些算力。
如果用得上,出租是選擇題。如果用不上,出租就是資產負債表的止疼藥。
最難判斷的地方也在這裡。Meta 可能只是在建設節奏裡騰出一段窗口,把暫時空出來的資源拿出去賣。它也可能是在告訴投資者,千億美元級別的 AI 支出不能一直靠遠方的 superintelligence 支撐,必須先找到一條更近的收入線。
這兩種說法都能成立。
需求沒有消失,只是開始挑人
Capex 是 AI 敘事的核心,沒有之一,和 21 年的放水一樣,Capex 的預期是一直增長,水一直放,市場炒的所有分支才會一起漲。一看到 Meta 準備賣算力,很多人第一反應是,AI capex 要塌了。大公司終於承認買多了,半導體的盛宴該散了。
這樣說太省事。
公開數據還不支持這麼乾脆的結論。AWS 一季度收入漲了 28%,到了 376 億美元,是這幾年少見的快增長。Google Cloud 一季度漲得更猛,收入到了 200 億美元。微軟 Azure 也還在 40% 左右的速度上跑。
亞馬遜還在說今年資本開支可能到 2000 億美元,Alphabet 把 2026 年資本開支指引抬到 1800 億到 1900 億美元,Meta 自己也把全年資本開支抬到 1250 億到 1450 億美元。
這些數字不像一場需求崩塌。
更像一場分流。
雲廠商的處境和模型廠商不一樣。雲廠商賣的是路。只要路上有人跑,無論車是誰造的,它都能收錢。OpenAI、Anthropic、企業客戶、政府客戶、創業公司,最後都要落在某一片資料中心、某一種晶片、某一條網路和某一個電力合同上。
所以三大雲可以繼續硬。
AWS 甚至在 6 月底提高了一個 AI 雲服務的價格,是給客戶提前鎖 GPU 的服務,AWS 把這個服務 7 月開始的價格又上調了大約 20%。1 月它已經調過一次,大約 15%。這不是需求疲軟時會出現的動作。
稀缺的時候,賣方漲價。
但模型公司不一定都能這麼舒服。
模型公司的資產要更挑剔。算力不是放在那裡就能產生收入。它要被更聰明的模型、更高頻的用戶、更貴的企業工作流不斷填滿。只有當模型足夠好,用戶才願意忍受排隊、限額、漲價和越來越複雜的訂閱層級。
這也是為什麼 Anthropic 會被市場看成另一類公司。它不是因為便宜,而是因為用戶願意把昂貴任務交給它。寫程式碼、改系統、跑長任務、接企業工作流,這些任務一旦真的進入生產環境,消耗的 token 會比閒聊大得多。
強模型的麻煩是機器不夠。
弱模型的麻煩是機器沒人心疼。
這兩個麻煩都叫算力,但它們不是同一種東西。
xAI 那條線也有同樣的味道。Grok 沒有像最強模型那樣形成清晰的企業心智,馬斯克體系裡的一部分算力卻可以流向 Anthropic。這個動作比任何口號都冷靜。機器不創始人,它只認誰能把它跑滿。
Google 與 Meta 的關係也說明事情沒那麼簡單。6 月有消息說,Google 限制了 Meta 對 Gemini 的使用,原因是 Meta 想買的算力超過了 Google 能提供的範圍,甚至影響了 Meta 內部一些 AI 項目。一個公司一邊考慮賣算力,一邊又在某些任務上買不到足夠的頭部模型能力。
這不是傳統意義上的過剩。
這是錯配。因為帳單開始變得刺眼。
雲廠商可以繼續漲價,因為它們賣的是確定性。客戶要的是一段時間內一定能拿到的 GPU,一片穩定的資料中心,一套不會半夜斷掉的基礎設施。
但企業客戶拿到算力以後,問題沒有結束。
它們還要把這張帳單交給 CFO。CFO 不會問你用了多少 token,他會問這些 token 替公司省了多少錢,多賺了多少錢,少犯了多少錯。
到了企業那裡,token 變成了電表
這就回到了開頭 Karp 那場採訪。
他把很多 AI 公司賣給企業的東西說過度銷售。上節目前一天,Palantir 還在 X 上發了一份九點聲明,講所謂 AI 主權,其中專門點了 tokenmaxxing 這種模式。這個詞很難翻,直譯出來難聽,但意思並不複雜,就是把消耗 token 當成進步,把燒錢當成使用,把帳單當成生產力。
Karp 把 OpenAI、Anthropic 這類前沿實驗室推到了桌面上。他的意思不是企業不該用最強模型,而是企業不該把自己的數據、流程和業務判斷都交出去,然後再按消耗量付一張越來越大的帳單。
Palantir 想賣的是另一種東西。不是一個通用聊天框,不是單一 API,而是把數據、審批、權限、運營規則和 AI 放進同一套業務系統裡。客戶花錢買的不是「用了多少次 AI」,而是某條生產線、某套風控流程、某個政府任務有沒有真的被改造。
企業裡真正管錢的人已經開始醒了。
UBS 最近和企業 IT 高管聊下來,一個方向很清楚。很多企業不是不用 AI 了,而是在給 AI 花錢裝剎車。大約 60% 的受訪企業在壓 token 開支、加使用護欄,尤其是那些已經過了試用期、開始把 AI 放進日常流程的公司。
這也是一個很有意思的反轉。
AI 從玩具變成工具以後,花錢反而更難了。玩具階段,老闆願意給預算,因為大家都怕錯過。工具階段,CFO 會問它替誰省了工時,替誰多賣了貨,替誰降低了風險。
在這張表上,token 不像收入。
它更像電表。
你當然可以說,電表轉得快說明工廠在開工。也可以說,電表轉得太快而產量沒上去,說明這台機器有問題。
AI agent 把這個問題放大了。OpenAI 和幾所大學的一篇 Codex 研究裡有一組數據很嚇人。2026 年上半年,Codex 活躍用戶增長超過五倍;OpenAI 內部一些崗位的輸出 token 也暴漲,法律崗位的中位數月輸出 token 比 2025 年 11 月高 13 倍,研究崗位高 50 多倍。
另一篇研究把事情說得更硬。agentic coding 任務消耗的 token,可以比普通程式碼聊天和程式碼推理高 1000 倍。同一個任務,不同運行之間的 token 消耗可能相差 30 倍。
這才是今天算力緊缺的底層。
不是大家多問了幾句聊天機器人。
是軟體開始變成一群會反覆讀文件、跑命令、改程式碼、失敗、重來、再失敗、再重來的小型工人。它們沒有午飯時間,但每一步都在吃 token。
當 token 變成電表,誰擁有發電廠,誰就有權力。可誰把電浪費掉,誰也會先被審問。
帳單一變厚,便宜模型就有了位置
CFO 一旦開始看這張電表,下一步幾乎不用人教。
他會問,哪些任務必須用最強模型,哪些任務只需要夠用的模型。
這時候,GLM、Kimi、DeepSeek、Qwen 這些開源模型就不再只是技術新聞。它們變成了企業採購桌上的砍價工具。
連矽谷頂級風投 a16z 的馬克·安德森都說,很多 AI 從業者已經把智譜 GLM-5.2 看成第一批能在多數任務中匹配、甚至超過美國頭部公開模型的中國模型。這個判斷未必是最終裁判,但它讓企業多了一句話。
Coinbase 給了更硬的例子。Brian Armstrong 說,公司把默認 AI 模型切到 GLM 5.2、Kimi 2.7 這類開源模型,再配合模型路由、快取和精簡上下文,Token 使用量還在指數級增長,AI 支出卻砍掉了接近一半。
這句話的殺傷力在於,企業第一次可以把模型能力拆開採購。
最難的任務,繼續交給最貴的模型。普通摘要、客服、資訊抽取、模板化程式碼、內部知識庫問答,交給便宜模型和本地部署。
開源模型未必要贏下全部戰場。
它只要讓採購部門相信,不是每一度電都要按豪宅電價付錢。
到了這裡,Meta 賣算力就不再是一條孤立新聞。
它和 Palantir 罵 token、Coinbase 切開源模型說的是同一件事:AI 的支出鏈條開始被拆開。上游賣確定性,中游賣結果,下游壓單價。每一層都還在增長,但每一層都開始被問,錢到底花得值不值。
最難的不是買機器,是讓機器一直有活幹
過去兩年,AI 行業最容易講的故事,是資源不夠。
GPU 不夠,電不夠,資料中心不夠,工程師不夠,能把模型跑起來的雲也不夠。這個故事太順了。只要東西不夠,所有人都會本能地往前衝。先佔位置,先簽電力,先買晶片,先把機器架起來。
搶資源的時候,人不太會算細帳。
因為慢一步的代價看起來更大。
但 Meta 這條消息把另一個問題推了出來。機器買回來以後,不會因為它貴,就自動變成好生意。它要每天有活幹,要有客戶願意付錢,要有模型把它跑滿,要有應用把成本轉成收入。
這就是利用率。
利用率這個詞聽上去很冷,其實很殘酷。它問的不是你有沒有未來,而是你今天這台機器有沒有開工。它不關心你在發布會上怎麼說,也不關心你買的是不是最貴的 GPU。它只看一件事:這筆錢有沒有變成持續的現金流。
雲廠商回答這個問題相對容易。它們本來就賣基礎設施。AWS、Google Cloud、Azure 賣的是路、電和機房。客戶要訓練模型,要跑推理,要託管應用,最後都要落在某一片雲上。
所以它們還可以硬。
強模型公司也有自己的回答。如果模型足夠強,用戶願意排隊,企業願意接入,開發者願意圍著它改工作流,那麼算力不是庫存,是瓶頸。機器越多,它越能跑得開。
最難的是中間那一層。
它們有機器,有故事,有模型團隊,也有很大的預算。可是模型沒有跑到最前面,產品沒有變成日常習慣,開發者也不願意為它改工作流。對這一類公司來說,算力從武器變成庫存,只需要一次模型發布失敗,或者一次用戶遷移。
庫存不一定沒用。
但庫存必須降價,必須出租,必須找新用途。
這就是 Meta 賣算力刺眼的地方。它不證明 Meta 失敗,也不證明 AI 需求消失。它只是讓市場第一次看見,AI 基礎設施也會遇到普通工廠遇到的問題。
工廠建好了,訂單在哪裡。
算力沒有消失,只是開始分層
所以這件事最好的理解,不是「算力過剩」。
這個詞太粗。
更準確的說法是,算力開始分層。
最上面那一層,仍然緊。最強模型、最好的雲、最穩定的 GPU 集群,還是有人搶。AWS 的服務能漲價,就是因為確定性本身有價格。客戶不是只買 GPU,它買的是某一天、某一小時、某一批機器一定能用。
中間那一層,開始尷尬。它也許不差,但不夠稀缺。它能跑模型,能做推理,也能賣給外部客戶。只是客戶會比較,會砍價,會問為什麼不用更便宜的模型,為什麼不用別人的雲,為什麼這批機器一定值這個價格。
最下面那一層,會被開源模型和成本優化一點點擠壓。企業不會為了普通任務永遠調用最貴模型。它們會做路由,會做快取,會壓上下文,會把模型拆成不同檔位。
需求長大了。
小孩子花錢不看帳單,成年人會看。AI 進入企業以後,也會經歷這個過程。試點階段,大家害怕錯過;規模化階段,大家開始算帳。
算帳以後,產業鏈就不會再像早期那樣整齊。
有人繼續漲價,因為他賣的是不可替代的確定性。有人改賣結果,因為客戶不想為消耗本身付錢。有人被迫降價,因為夠用的替代品出現了。有人把機器租出去,因為機器閒著比低價出租更難看。
這幾件事同時發生,就會讓行業看起來矛盾。
一邊是算力緊缺。
一邊是算力出租。
一邊是 token 消耗暴漲。
一邊是企業壓低 AI 支出。
一邊是頭部模型越來越強。
一邊是開源模型越來越便宜。
它們並不衝突。它們只是說明,AI 已經從一個總量故事,進入一個結構故事。
舊鐵路的故事還會再講一遍
十九世紀的鐵路泡沫裡,鐵路不是假的。
鐵軌鋪下去,貨物真的會走,城市真的會長,時間真的會被縮短。很多後來最有價值的商業網路,確實長在那些鐵軌旁邊。
可這不妨礙當年很多修鐵路的人虧錢。
他們輸的不是方向。他們輸在修早了,修多了,修到了沒有客貨流的地方,或者借了太貴的錢去修一條太慢才能回本的路。
網際網路泡沫裡的光纖也是一樣。光纖沒有錯。後來整個世界都被它托起來。錯的是那一批帳本,它們把未來幾十年的需求一次性塞進了幾年的資本開支裡。
AI 資料中心可能也會留下很多有用的東西。GPU 會折舊,電力合同會續簽,資料中心會換設備,軟體會越來越會吃算力。今天看起來誇張的 token 消耗,幾年後也許會像高清影片流量一樣普通。
但資產有自己的脾氣。
它不關心你信不信未來。它只關心每天有沒有人來用。
Meta 賣算力的訊號,就卡在這個地方。
它不是 AI 的終點。也不是半導體的終點。它更像資本開支敘事走到中段時,第一次有人把門打開,讓外面的人看見倉庫裡有多少機器。
有些機器會被頭部模型吃掉。
有些機器會被雲客戶租走。
有些機器會在價格戰裡變便宜。
還有一些機器,會靜靜地等一個還沒出現的應用。
過去兩年,市場願意相信所有機器最後都會等到自己的命運。現在它開始問,誰先等到,誰等不到,誰等到了也賺不到足夠的錢。
這個問題一出來,AI 的故事就變了。
它不再只屬於那些買機器最快的人。
它屬於那些能讓機器一直轉下去的人。
點擊了解律動 BlockBeats 在招崗位
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia