MiniMax M2.7 mô hình đăng nhập điểm cuối tăng tốc GPU của NVIDIA, hỗ trợ NemoClaw và OpenClaw

robot
Đang tạo bản tóm tắt

Thông tin ME News, ngày 12 tháng 4 (UTC+8), Công ty MiniMax thông báo rằng mô hình M2.7 hiện đã có sẵn trên các điểm cuối được tăng tốc bằng GPU của NVIDIA, đồng thời hỗ trợ các công cụ bao gồm NemoClaw và OpenClaw. M2.7 là phiên bản mới nhất của dòng M2, nhằm nâng cao quy trình làm việc của các tác nhân, cũng như các nghiên cứu về suy luận, học máy và các ứng dụng phức tạp khác. Đây là một mô hình chuyên gia hỗn hợp thưa, có tổng số tham số là 230 tỷ, số tham số kích hoạt mỗi token là 10 tỷ, tỷ lệ kích hoạt khoảng 4,3%, hỗ trợ độ dài ngữ cảnh 200.000 token, có 256 chuyên gia cục bộ, mỗi token kích hoạt 8 chuyên gia, gồm 62 lớp. Để hỗ trợ triển khai, NVIDIA đã phát hành bộ khung tham khảo mã nguồn mở NemoClaw nhằm đơn giản hóa việc triển khai an toàn OpenClaw, và có thể khởi động một cách dễ dàng qua nền tảng đám mây NVIDIA Brev. Ngoài ra, NVIDIA còn hợp tác với cộng đồng mã nguồn mở để tích hợp các kernel hiệu suất cao tối ưu cho các mô hình MoE quy mô lớn trong các framework như vLLM và SGLang. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim