寒武纪 đã hoàn thành việc thích ứng DeepSeek-V4, mã nguồn đã được mở, thúc đẩy cổ phiếu chip nội địa tăng mạnh.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 24 tháng 4 (UTC+8), theo giám sát của Dongcha Beating, Cambricon thông báo đã hoàn tất việc thích ứng hai mô hình 285B DeepSeek-V4-Flash và 1.6T DeepSeek-V4-Pro ngay trong ngày phát hành V4, dựa trên khung suy luận vLLM, mã thích ứng đã được mã nguồn mở trên GitHub. Tốc độ thích ứng phụ thuộc vào hai tiền đề: một là phần mềm NeuWare tự phát triển của Cambricon hỗ trợ nguyên bản các khung chính như PyTorch, vLLM, mô hình có thể di chuyển nhanh chóng; hai là chip của Cambricon hỗ trợ nguyên bản các định dạng dữ liệu độ chính xác thấp chính thống, có thể hoàn tất xác minh độ chính xác mà không cần chuyển đổi định dạng bổ sung. Đối với cấu trúc mới của V4, Cambricon thông qua thư viện toán tử hợp nhất tự phát triển Torch-MLU-Ops, đã tăng tốc chuyên biệt cho các mô-đun như Compressor, mHC, và viết các nhân toán tử nóng như Attention thưa/nén, GroupGemm bằng BangC. Ở cấp độ khung suy luận, Cambricon hỗ trợ trong vLLM hỗn hợp song song năm chiều TP/PP/SP/DP/EP, song song tính toán truyền thông, lượng tử hóa độ chính xác thấp và triển khai tách rời PD. Báo cáo kỹ thuật V4 chỉ đề cập đến xác minh trên NVIDIA GPU và Huawei Ascend NPU, không liên quan đến nền tảng Cambricon, lần thích ứng này do Cambricon tự hoàn thành. Được kích thích bởi tin tức phát hành V4, cổ phiếu ngành chip nội địa A股 tăng mạnh, cổ phiếu Cambricon tăng thẳng đứng trong phiên. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim