谷歌發布第八代TPU,訓練推理首次分為兩顆獨立晶片

robot
摘要生成中
ME News 消息,4 月 22 日(UTC+8),據 動察 Beating 監測,谷歌 CEO Sundar Pichai 在 Cloud Next 2026 上發布第八代 TPU,首次將訓練和推理拆成兩顆獨立芯片。 TPU 8t 面向訓練。單個超級節點可連接 9600 顆 TPU,提供 121 ExaFlops 算力和 2PB 共享高帶寬內存,處理性能為上一代 Ironwood 的 3 倍,能效提升最高 2 倍。芯片間互聯帶寬翻倍,配合新推出的 Virgo 網絡拓撲,最多可將 100 萬顆芯片組成單個邏輯集群,實現近線性擴展。谷歌稱目標是將前沿模型的開發週期從數月縮短到數周。 TPU 8i 面向推理。單 pod 連接 1152 顆 TPU,配備 288GB 高帶寬內存和 384MB 片上 SRAM,後者為 Ironwood 的 3 倍,用於將活躍模型數據儘量留在芯片上。新的 Boardfly 網絡拓撲大幅降低延遲,谷歌稱同等成本下可服務近兩倍的客戶量,目標是支撐數百萬個 agent 同時運行。 兩款芯片均托管在谷歌自研 Arm 架構 Axion CPU 上,配合第四代液冷散熱。計劃 2026 年晚些時候在 Google Cloud AI Hypercomputer 平台上正式供應,與英偉達 GPU 實例並列提供。 (來源:BlockBeats)
GOOGLX-4.62%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆