ME News ニュース、2024年4月22日(UTC+8)、動察Beatingの監視によると、GoogleのCEOサンダー・ピチャイはCloud Next 2026で第八世代TPUを発表し、訓練と推論を初めて2つの独立したチップに分離しました。 TPU 8tは訓練向けです。単一のスーパー・ノードは9600個のTPUに接続でき、121エクサフロップスの計算能力と2PBの共有高帯域メモリを提供し、性能は前世代のIronwoodの3倍、エネルギー効率は最大2倍向上しています。チップ間の相互接続帯域幅は倍増し、新たに導入されたVirgoネットワークトポロジーと組み合わせることで、最大100万個のチップを単一の論理クラスターに構成し、ほぼ線形の拡張を実現します。Googleは、最先端モデルの開発サイクルを数か月から数週間に短縮することを目標としています。 TPU 8iは推論向けです。1つのポッドは1152個のTPUに接続され、288GBの高帯域メモリと384MBのオンチップSRAMを搭載し、後者はIronwoodの3倍で、アクティブなモデルデータをできるだけチップ上に保持するために使用されます。新しいBoardflyネットワークトポロジーは遅延を大幅に低減し、Googleは同じコストでほぼ2倍の顧客数にサービスを提供できると述べており、数百万のエージェントが同時に稼働できることを目標としています。両方のチップはGoogle独自開発のArmアーキテクチャAxion CPU上にホスティングされ、第四世代液冷冷却と組み合わせられています。2026年後半にGoogle Cloud AI Hypercomputerプラットフォームで正式に提供され、NVIDIAのGPUインスタンスと並列して提供される予定です。(出典:BlockBeats)
Googleは第8世代TPUを発表し、トレーニングと推論を初めて2つの独立したチップに分離しました