算力告急:谷歌悄然對Meta實施Gemini使用上限

robot
摘要生成中

人工智慧基礎設施的供需矛盾正在全球頂級科技公司之間激化。據知情人士透露,谷歌約於今年3月告知Meta,無法滿足其全部Gemini算力需求,並對這家社交媒體巨頭實施了使用上限——即便是全球最大的AI服務商,也難以應對洶湧而來的算力需求。

據英國《金融時報》報導,上述限制至今仍未解除,已導致Meta多個內部AI項目遭到干擾和延誤。受此影響,Meta已要求員工提高AI算力使用效率,在內部推行對AI token的精打細算。谷歌與Meta均拒絕就此置評。

這一局面迫使谷歌加快擴容步伐。谷歌本月早些時候與埃隆·馬斯克旗下SpaceX簽訂了一份每月9.2億美元的算力租賃協議。谷歌CEO桑達爾·皮查伊在今年一季度財報會議上坦言:「近期我們在算力方面確實面臨制約,如果能夠滿足需求,雲業務收入將會更高。」

Meta並非孤例。多位知情人士指出,其他谷歌企業客戶同樣受到程度不一的限制,而Meta因需求規模異常龐大受影響最深。這場風波折射出AI推理工作負載的爆炸式增長,已成為整個行業面臨的最大挑戰之一。

算力瓶頸持續承壓,大客戶首當其衝

儘管各大科技公司已在晶片、數據中心和電力供應上砸下數百億美元,AI算力供給仍難以追上需求增速。

谷歌一季度雲業務收入首次突破200億美元,已簽署但尚未交付的雲合同積壓量環比幾乎翻番,超過4600億美元。皮查伊明確表示,算力制約在短期內仍將持續。

在此背景下,Meta受到的衝擊尤為突出。知情人士表示,正是Meta等大型企業客戶的高強度需求,直接推動谷歌加速尋求外部算力來源。隨著企業大規模部署聊天機器人、編程助手和AI智能體,推理工作負載——即模型訓練完成後在實際應用中執行任務所消耗的算力——正成為行業的核心瓶頸。

Meta內部項目受阻,加速轉向自研模型

Meta在內部廣泛使用Gemini,涵蓋平台安全審核(包括識別詐騙內容、清除有害信息)、客服及廣告輔助聊天機器人,以及部分內部工作流和程式碼開發,同時搭配使用Anthropic的Claude等其他模型。

據知情人士透露,Meta最初選擇Gemini,是因為其表現優於公司自研的Llama開源模型。然而隨著算力限制的收緊,Meta正加快向自研模型遷移。多位知情人士表示,Meta近期已開始優先推廣其新推出的Muse Spark模型,該模型被認為在性能上已能與Gemini相抗衡,有助於降低對外部模型的依賴。

Meta CEO馬克·扎克伯格此前持續加大對AI人才和基礎設施的投入,致力於打造其所稱的「個人超級智能」。與谷歌不同,Meta沒有雲業務,正在加速自建數據中心體系,並承諾到2028年在美國累計投資6000億美元。

谷歌藉道SpaceX擴容,行業尋求破局

面對算力壓力,谷歌本月與SpaceX簽署每月9.2億美元的算力租賃協議,以彌補基礎設施缺口。AI實驗室Anthropic上月也與SpaceX達成了類似協議。

谷歌對Meta採取限制措施一事,為外界提供了一個罕見窗口,得以窺見全球頂級AI服務商在算力分配上所面臨的真實壓力。當前,整個AI行業的基礎設施瓶頸正從訓練側蔓延至推理側,供需矛盾的化解仍有賴於新一輪大規模資本投入的落地兌現。

風險提示及免責條款

        市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆