Dòng Xiaomi MiMo-V2.5 Mã nguồn mở: 1T Tham số theo Giấy phép MIT, Hiệu quả Token vượt qua GPT-5.4 trên ClawEval

robot
Đang tạo bản tóm tắt

Theo giám sát của Dongcha Beating, nhóm Xiaomi MiMo đã mở mã nguồn loạt mô hình lớn MiMo-V2.5, bao gồm hai mô hình, đều dưới giấy phép MIT, hỗ trợ triển khai thương mại, tiếp tục đào tạo và tinh chỉnh, với cửa sổ ngữ cảnh lên tới 1 triệu token. MiMo-V2.5-Pro là mô hình MoE thuần văn bản (kiến trúc Mixture of Experts) với tổng cộng 1,02 nghìn tỷ tham số và 42 tỷ tham số hoạt động; MiMo-V2.5 là mô hình đa phương tiện gốc với tổng cộng 310 tỷ tham số và 15 tỷ tham số hoạt động, hỗ trợ hiểu văn bản, hình ảnh, video và âm thanh. MiMo-V2.5-Pro chủ yếu hướng tới các nhiệm vụ phức tạp về tác nhân và lập trình. Trong đánh giá ClawEval, V2.5-Pro đạt tỷ lệ Pass^3 64%, đạt mức tương đương trong khi tiêu thụ chỉ khoảng 70.000 token cho mỗi quỹ đạo nhiệm vụ, thấp hơn khoảng 40% đến 60% so với Claude Opus 4.6, Gemini 3.1 Pro và GPT-5.4. Điểm số Verified của SWE-bench là 78,9. Trong một ví dụ được trình bày trên blog chính thức, V2.5-Pro tự động thực hiện một trình biên dịch đầy đủ từ SysY sang RISC-V cho dự án nguyên lý biên dịch tại Đại học Bắc Kinh, mất 4,3 giờ và 672 lần gọi công cụ, đạt điểm hoàn hảo 233/233 trên bộ kiểm tra ẩn. MiMo-V2.5 được thiết kế cho các tình huống tác nhân đa phương tiện, trang bị bộ mã hóa hình ảnh riêng (ViT 729 triệu tham số) và bộ mã hóa âm thanh (261 triệu tham số), đạt điểm 62,3 trên phần phụ Claw-Eval chung. Cả hai mô hình sử dụng kiến trúc kết hợp của chú ý cửa sổ trượt (SWA) và chú ý toàn cục (GA), cùng với mô-đun dự đoán đa token (MTP) gồm 3 lớp (dự đoán nhiều token cùng lúc để tăng tốc suy luận). Trọng số đã được phát hành trên Hugging Face. Cùng với việc phát hành mã nguồn mở, nhóm MiMo đã ra mắt ‘Chương trình Khuyến khích Người sáng tạo Token Trillion Orbit’, cung cấp tổng cộng 100 nghìn tỷ token miễn phí cho người dùng toàn cầu trong vòng 30 ngày. Các nhà phát triển cá nhân, nhóm và doanh nghiệp có thể đăng ký trên trang sự kiện, với thời gian đánh giá khoảng 3 ngày làm việc. Sau khi được phê duyệt, lợi ích sẽ được ghi có dưới dạng Kế hoạch Token hoặc trợ cấp, có thể trực tiếp sử dụng với các công cụ lập trình như Claude Code và Cursor.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim