MiniMax M3 tham số này khá mạnh, mở nguồn trong 10 ngày chờ đợi một cảnh tượng thật đã mắt

Xem bản gốc
CoinNetwork
MiniMax phát hành mô hình lớn M3: khả năng lập trình vượt xa GPT-5.5, hỗ trợ điều khiển đa phương thức đa dạng trên desktop nguyên bản
Tin tức từ币界网, MiniMax chính thức ra mắt mô hình lớn M3 hôm nay.
M3 là mô hình lớn mã nguồn mở duy nhất hiện nay tích hợp đầy đủ ba yếu tố tiên tiến: lập trình, ngữ cảnh siêu dài và đa phương thức nguyên bản, dự kiến sẽ mở mã trong vòng 10 ngày tới.
Đạt trình độ hàng đầu quốc tế về tạo mã, trí tuệ nhân tạo và điều khiển desktop, có thể trải nghiệm qua MiniMax code, token plan và API.
M3 lần đầu tiên giới thiệu kiến trúc chú ý thưa MSA, thông qua khối KV tổng hợp các truy vấn trúng, truy cập bộ nhớ nhanh gấp 4 lần so với Flash-sparse-attention.
Trong ngữ cảnh 1 triệu token, kiến trúc mới giảm lượng tính toán cho mỗi token xuống còn 1/20 so với thế hệ trước, đạt tốc độ tiền điền 9 lần, giải mã 15 lần.
Trên SWE-bench pro, M3 đạt điểm 59.0%, vượt xa GPT-5.5 và Gemini 3.1.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim