Google Cloud A4X Max máy chủ kim loại trần hỗ trợ 50.000 cụm GPU, băng thông mạng tăng gấp đôi

robot
Đang tạo bản tóm tắt
Thông tin ME News, ngày 19 tháng 4 (UTC+8), Google Cloud công bố rằng các phiên bản A4X Max bare-metal có thể hỗ trợ cụm lên đến 50.000 GPU, băng thông mạng gấp đôi so với thế hệ trước. Phiên bản này thuộc dòng máy tối ưu hóa cho Google Compute Engine Accelerator, dòng máy này được cài đặt sẵn GPU NVIDIA, được thiết kế dành riêng cho AI, học máy, tính toán hiệu suất cao và các ứng dụng đòi hỏi đồ họa cao. Tài liệu chi tiết giới thiệu nhiều dòng máy bao gồm A4X Max, A4X, A4, A3, A2, G4 và G2, và đề xuất các dòng phù hợp dựa trên loại tải công việc (như huấn luyện trước, tinh chỉnh, suy luận, đồ họa, tính toán hiệu suất cao). Ngoài ra, tài liệu còn giải thích về các tùy chọn định giá và tiêu thụ dựa trên GPU cài sẵn, vCPU, bộ nhớ và SSD cục bộ (theo yêu cầu, Spot, Flex-start, đặt trước), cũng như trải nghiệm bảo trì của các loại máy khác nhau. (Nguồn: InFoQ)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • 2
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
NoMoreRugs
· 4giờ trước
Giá SSD cục bộ cuối cùng đã trở nên minh bạch hơn, trước đây còn ẩn sâu.
Xem bản gốcTrả lời0
ZkSketcher
· 4giờ trước
Từ G2 đến toàn bộ dòng A4X đã được bao phủ, các doanh nghiệp nhỏ và vừa cũng có thể tham gia một chút.
Xem bản gốcTrả lời0
GateUser-6fd3205e
· 4giờ trước
Spot instance để đào tạo AI? Bị gián đoạn một lần là phải bắt đầu lại từ đầu, mệt mỏi quá
Xem bản gốcTrả lời0
ChecksumSmile
· 4giờ trước
Tiền huấn luyện đề xuất A4X, suy luận dùng G2, phân chia này khá chi tiết
Xem bản gốcTrả lời0
FeeTaker
· 4giờ trước
Flex-start là gì, là sự pha trộn giữa theo nhu cầu và dự phòng?
Xem bản gốcTrả lời0
RugProofRita
· 4giờ trước
Độ phức tạp lập lịch của cụm 50.000 thẻ, Kubernetes có thể chịu đựng nổi không
Xem bản gốcTrả lời0
MistValleyFront
· 4giờ trước
Google Cloud lần này rõ ràng đang cạnh tranh trực tiếp với AWS Trainium
Xem bản gốcTrả lời0
DaoBackbencher
· 4giờ trước
Việc duy trì trải nghiệm khác biệt này rất tinh tế, ý là có người sẽ nổ?
Xem bản gốcTrả lời0
  • Đã ghim