谷歌发布第八代TPU,训练推理首次分为两颗独立芯片

robot
摘要生成中
ME News 消息,4 月 22 日(UTC+8),据 动察 Beating 监测,谷歌 CEO Sundar Pichai 在 Cloud Next 2026 上发布第八代 TPU,首次将训练和推理拆成两颗独立芯片。 TPU 8t 面向训练。单个超级节点可连接 9600 颗 TPU,提供 121 ExaFlops 算力和 2PB 共享高带宽内存,处理性能为上一代 Ironwood 的 3 倍,能效提升最高 2 倍。芯片间互联带宽翻倍,配合新推出的 Virgo 网络拓扑,最多可将 100 万颗芯片组成单个逻辑集群,实现近线性扩展。谷歌称目标是将前沿模型的开发周期从数月缩短到数周。 TPU 8i 面向推理。单 pod 连接 1152 颗 TPU,配备 288GB 高带宽内存和 384MB 片上 SRAM,后者为 Ironwood 的 3 倍,用于将活跃模型数据尽量留在芯片上。新的 Boardfly 网络拓扑大幅降低延迟,谷歌称同等成本下可服务近两倍的客户量,目标是支撑数百万个 agent 同时运行。 两款芯片均托管在谷歌自研 Arm 架构 Axion CPU 上,配合第四代液冷散热。计划 2026 年晚些时候在 Google Cloud AI Hypercomputer 平台上正式供应,与英伟达 GPU 实例并列提供。 (来源:BlockBeats)
GOOGLX-4.50%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论