GPU tính toán đã đạt đến đỉnh, nhưng lại bị kẹt ở băng thông bộ nhớ — quan điểm của Jukan này khá phản trực giác, nhưng nghĩ kỹ thì đúng thật, vị thế của HBM cần được sắp xếp lại rồi.

Xem bản gốc
CoinNetwork
Tin tức từ CoinWorld, nhà phân tích Jukan của Citrini Research cho biết, hiệu suất suy luận của các mô hình AI không chỉ đạt được bằng cách tăng số lượng GPU Nvidia. GPU thường ở trạng thái nhàn rỗi với tỷ lệ sử dụng thấp do nút thắt cổ chai bộ nhớ trong quá trình suy luận. Tỷ lệ hoàn vốn đầu tư cho suy luận phụ thuộc vào bộ nhớ chứ không phải GPU, và tầm quan trọng của Micron có thể vượt qua Nvidia.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim