Giao thức mạng siêu máy tính tự phát triển của OpenAI MRC mã nguồn mở: 100.000 GPU chỉ cần hai lớp chuyển mạch, khôi phục lỗi giảm từ giây xuống microgiây

Thông báo từ CoinWorld, giao thức mạng MRC (Multipath Reliable Connection) do OpenAI hợp tác phát triển cùng AMD, Broadcom, Intel, Microsoft và Nvidia đã được mở mã nguồn, hỗ trợ 100.000 GPU chỉ cần hai lớp chuyển mạch, giảm thời gian khôi phục lỗi từ giây xuống microgiây. Giao thức này đã tích hợp sẵn trong card mạng mới nhất có băng thông 800GB/s và được phát hành qua OCP (Open Compute Project), hiện đã triển khai trên tất cả các siêu máy tính Nvidia GB200 quy mô lớn của OpenAI, bao gồm cả cụm Abilene tại Texas hợp tác với Oracle và siêu máy tính Fairwater của Microsoft. Điểm thay đổi cốt lõi của MRC là phân chia một lần truyền dữ liệu thành hàng trăm đường dẫn đồng thời gửi đi, tránh vấn đề GPU rỗng chạy do độ trễ truyền tải trong mạng siêu máy tính truyền thống.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim