Googleは第8世代TPUを発表：8tはトレーニング用で、単一ノードで9600個と接続可能、121 ExaFlops、2PBの高帯域メモリを搭載し、性能とエネルギー効率が大幅に向上、Virgoトポロジーはほぼ線形に拡張して100万チップに対応可能；8iは推論用で、1つのPodに1152個、288GBの高帯域メモリ、384MBのSRAMを搭載し、遅延がさらに低減されている。両者ともAxion CPUと液冷冷却を搭載し、2026年後半にGoogle Cloud AI Hypercomputer上で提供予定で、Nvidia GPUインスタンスと並列して展開される。

MeNews

2026-04-22 18:20:18

概要作成中

ME News ニュース、2024年4月22日（UTC+8）、動察 Beating の監測によると、Google CEO Sundar Pichai は Cloud Next 2026 で第八世代 TPU を発表し、訓練と推論を初めて二つの独立したチップに分離しました。 TPU 8t は訓練向けです。単一のスーパー・ノードは 9600 個の TPU に接続でき、121 ExaFlops の計算能力と 2PB の共有高帯域メモリを提供し、処理性能は前世代の Ironwood の3倍、エネルギー効率は最大2倍向上しています。チップ間の相互接続帯域幅は倍増し、新たに導入された Virgo ネットワークトポロジーと組み合わせることで、最大で100万個のチップを一つの論理クラスターに構成し、ほぼ線形の拡張を実現します。Google は、最先端モデルの開発サイクルを数か月から数週間に短縮することを目標としています。 TPU 8i は推論向けです。1つのポッドは1152個の TPU に接続され、288GB の高帯域メモリと 384MB のオンチップ SRAM を備え、後者は Ironwood の3倍で、アクティブなモデルデータをできるだけチップ上に保持するために使用されます。新しい Boardfly ネットワークトポロジーは遅延を大幅に低減し、Google は同じコストでほぼ2倍の顧客数にサービスを提供できると述べており、数百万のエージェントが同時に稼働できることを目標としています。両チップとも Google 独自開発の Arm アーキテクチャ Axion CPU 上にホスティングされ、第四世代液冷冷却と組み合わせられています。2026年後半に Google Cloud AI Hypercomputer プラットフォーム上で正式に提供され、NVIDIA GPU インスタンスと並列して提供される予定です。（出典：BlockBeats）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。