Google công bố chi tiết kiến trúc mạng cấp khung máy của TPU thế hệ thứ tám 8t

robot
Đang tạo bản tóm tắt
AIMPACT Tin nhắn, ngày 16 tháng 5 (UTC+8), Google tiết lộ chi tiết kiến trúc của TPU 8 thế hệ (TPU 8t) kết nối theo dạng rack đến mạng Virgo. Mạng này sử dụng switch có bậc cao và kiến trúc hai lớp không chặn phẳng, nâng cao băng thông mạng trung tâm dữ liệu gấp 4 lần so với thế hệ trước, một cấu trúc có thể kết nối hơn 134.000 chip TPU 8t, cung cấp băng thông hai chiều không chặn 47 Pb/s và hiệu suất mở rộng gần tuyến tính hơn 1.7K ExaFlops. TPU 8t tự nó sử dụng kiến trúc vòng tròn 3D, một super pod có thể mở rộng đến 9600 chip, và hỗ trợ mở rộng qua JAX và Pathways lên hơn 1 triệu chip. Các công nghệ chính bao gồm bộ tăng tốc SparseCore, chồng chéo và cân bằng mở rộng VPU/MXU, hỗ trợ gốc FP4, và tích hợp CPU dựa trên Arm Axion để loại bỏ nút cổ chai của máy chủ. Thiết kế này nhằm hướng tới sự tiến hóa của mô hình AI từ các mô hình ngôn ngữ lớn tập trung đến các mô hình hỗn hợp quy mô lớn và kiến trúc dựa trên suy luận đòi hỏi cao. (Nguồn: InFoQ)
GOOGLX0,54%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 10
  • 2
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Semi-MeltedIceCream
· 9giờ trước
Chi phí của bộ chuyển mạch có số lượng lớn không thấp phải không, vậy các nhà cung cấp đám mây phải tính bao lâu để thu hồi vốn?
Xem bản gốcTrả lời0
HypeVaccinated
· 13giờ trước
Trung tâm siêu máy tính mới xây xong đã bị Google Cloud vượt mặt, tốc độ cập nhật này ai theo kịp đây
Xem bản gốcTrả lời0
LeverageWhisperer
· 14giờ trước
SparseCore và FP4 hỗ trợ nguyên bản có chút gì đó, chi phí suy luận lại bị giảm xuống.
Xem bản gốcTrả lời0
GateUser-6da8ed4c
· 14giờ trước
Vi xử lý Arm Axion tích hợp vào bên trong, không cần phải kết nối với máy chủ bên ngoài nữa, thiết kế khá thông minh
Xem bản gốcTrả lời0
Stop-LossLineForTheEveningGlow
· 14giờ trước
JAX/Pathways trực tiếp mở rộng lên đến hàng triệu, Google đang thúc ép các framework khác không theo kịp
Xem bản gốcTrả lời0
GateUser-7919e6b9
· 14giờ trước
13.4万 chip đơn cấu trúc, vùng lỗi này làm thế nào để chia? Tò mò quản trị vận hành làm sao?
Xem bản gốcTrả lời0
PaperSculptureOctopus
· 14giờ trước
Chờ đã, 8t là thế hệ thứ tám? Tôi vẫn chưa chạm vào TPU v5 còn nóng hổi nữa.
Xem bản gốcTrả lời0
GateUser-9d67589f
· 14giờ trước
3D vòng tròn topology + hai lớp không chặn, phần mạng thực sự đã bỏ nhiều công sức
Xem bản gốcTrả lời0
SpiralSeaSalt
· 14giờ trước
Hàng triệu chip tập hợp... Đây có phải là để huấn luyện ra Skynet không
Xem bản gốcTrả lời0
Post-RainCandlestick
· 14giờ trước
Google lần này đã làm cho TPU trở nên đặc biệt, 47 Pb/s là khái niệm gì vậy, nhà tôi dùng internet cáp quang phải khóc thảm hại trong nhà vệ sinh
Xem bản gốcTrả lời0
Xem thêm
  • Đã ghim