Google phát hành TPU thế hệ thứ tám, huấn luyện và suy luận lần đầu tiên chia thành hai chip độc lập

robot
Đang tạo bản tóm tắt

Tin tức ME, ngày 22 tháng 4 (UTC+8), theo theo dõi của Động Chấn Beating, CEO Google Sundar Pichai đã công bố TPU thế hệ thứ tám tại Cloud Next 2026, lần đầu tiên tách riêng huấn luyện và suy luận thành hai chip độc lập. TPU 8t hướng tới huấn luyện. Một nút siêu lớn có thể kết nối 9600 TPU, cung cấp 121 ExaFlops công suất tính toán và 2PB bộ nhớ truy cập cao băng thông chia sẻ, hiệu năng xử lý gấp 3 lần thế hệ Ironwood trước đó, hiệu quả năng lượng tăng tối đa gấp 2 lần. Băng thông liên kết giữa các chip tăng gấp đôi, kết hợp với kiến trúc mạng Virgo mới ra mắt, tối đa có thể tạo thành một cụm logic gồm 1 triệu chip, mở rộng gần như tuyến tính. Google cho biết mục tiêu là rút ngắn chu kỳ phát triển mô hình tiên tiến từ vài tháng xuống còn vài tuần. TPU 8i hướng tới suy luận. Một pod kết nối 1152 TPU, trang bị 288GB bộ nhớ băng thông cao và 384MB SRAM tích hợp trên chip, gấp 3 lần Ironwood, dùng để giữ dữ liệu mô hình hoạt động càng lâu trên chip càng tốt. Kiến trúc mạng Boardfly mới giảm đáng kể độ trễ, Google cho biết với cùng chi phí có thể phục vụ gần gấp đôi số lượng khách hàng, mục tiêu là hỗ trợ hàng triệu agent cùng lúc chạy. Cả hai chip đều chạy trên CPU Axion dựa trên kiến trúc Arm do Google tự phát triển, kết hợp làm mát bằng chất lỏng thế hệ thứ tư. Dự kiến sẽ chính thức cung cấp vào cuối năm 2026 trên nền tảng Google Cloud AI Hypercomputer, cùng với các phiên bản GPU của Nvidia. (Nguồn: BlockBeats)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim