Xiaomi và MiniMax cùng tung ra chiến lược lớn, cuộc chiến định giá của Agent chính thức bắt đầu

MarsBitNews · 2026-03-20T08:05:39+00:00

Xiaomi và MiniMax gần đây đã cùng phát hành các mô hình AI lớn của riêng mình, bắt đầu cuộc chiến định giá Agent. M2.7 của MiniMax và MiMo-V2-Pro của Xiaomi có hiệu suất gần tương đương, nhưng chênh lệch giá cả rõ rệt. Hai công ty đã áp dụng các tuyến đường công nghệ khác nhau và chiến lược lặp lại, MiniMax thường xuyên lặp lại với các bước nhỏ, trong khi Xiaomi chọn bước nhảy quy mô lớn. Mô hình ẩn danh Hunter Alpha của Xiaomi đã nhanh chóng nhận được sự chú ý nhờ giá thấp và hiệu suất xuất sắc.

MarsBitNews

2026-03-20 08:05:39

Đang tạo bản tóm tắt

Tiêu đề bài viết: Xiaomi và MiniMax cùng tung đòn lớn, cuộc chiến định giá Agent chính thức bắt đầu

Tác giả: Lục Động BlockBeats

Nguồn:

Chuyển thể: Mars Finance

Ngày 18 và 19 tháng 3, hai công ty Trung Quốc lần lượt công bố các mô hình lớn hướng Agent của riêng mình. Công ty khởi nghiệp AI trong nước MiniMax ra mắt M2.7, trong khi đội ngũ mô hình lớn của Xiaomi là MiMo giới thiệu V2-Pro. Cả hai mô hình đều lọt vào top hàng đầu toàn cầu trong benchmark Agent, nhưng giá API đầu ra của chúng lần lượt là 1/21 và 1/8 của Claude Opus 4.6.

Hai công ty cùng ra mắt trong cùng một tuần, nhưng bộ bài của họ hoàn toàn khác nhau. Chúng đại diện cho hai hướng công nghệ hoàn toàn khác biệt, đặt cược vào hai tương lai của thời đại Agent.

Cùng kỳ thi, học phí 1/17

Trước tiên, hãy xem so sánh trực quan nhất.

Theo dữ liệu từ OpenRouter và trang định giá chính thức của các công ty, tính theo giá đầu ra API (mỗi triệu tokens), MiniMax M2.7 là 1,2 USD, MiMo-V2-Pro là 3 USD. Để tham khảo, giá đầu ra của Claude Opus 4.6 là 25 USD, GPT-5.2 là 14 USD, Claude Sonnet 4.6 là 15 USD.

Khoảng cách về giá là cấp số nhân, nhưng khả năng lại không. Trên SWE-bench Verified (benchmark đo lường khả năng kỹ thuật mã nguồn hiện phổ biến nhất), MiMo-V2-Pro đạt 78%, Sonnet 4.6 là 79.6%, chênh lệch chưa đến hai phần trăm. M2.7 đạt 56.22% trên SWE-Pro, bằng với GPT-5.3-Codex. Trên VIBE-Pro (khả năng giao hàng dự án từ đầu đến cuối), M2.7 đạt 55.6%, gần bằng mức của Opus 4.6.

Điểm nhấn của biểu đồ này không nằm ở ai cao hơn ai thấp hơn — hệ thống benchmark của các bên không hoàn toàn đồng bộ, so sánh trực tiếp cần thận trọng. Điểm chính là sự “chênh lệch giá - hiệu năng”: mô hình Agent nội địa đã lọt vào cùng một vùng khả năng, nhưng đứng ở các mức giá hoàn toàn khác nhau.

Trillion tham số vs tự tiến hóa

Chỉ riêng về giá là bề nổi. Hai công ty đã đưa ra hai bộ bài hoàn toàn khác nhau.

MiMo-V2-Pro theo hướng “lực lớn tạo kỳ tích”. Theo thông báo chính thức của Xiaomi, V2-Pro có tổng tham số vượt quá 1 nghìn tỷ, kích hoạt tham số 42B, hỗ trợ ngữ cảnh dài 1 triệu tokens. Đổi mới cốt lõi của nó là cơ chế Attention lai Hybrid, kết hợp tỷ lệ Attention trượt (SWA) và Attention toàn cục (GA) lên đến 7:1 — phiên bản trước là 5:1. Cấu trúc này giúp mô hình ổn định hơn khi xử lý các tài liệu dài, nhiều công cụ cùng hoạt động trong các tình huống Agent. Trên PinchBench (đánh giá khả năng gọi công cụ của Agent), MiMo-V2-Pro đạt 84%.

M2.7 theo một hướng hoàn toàn khác. Theo blog kỹ thuật chính thức của MiniMax ngày 18 tháng 3, số lượng tham số của M2.7 chưa được công bố, nhưng nó thể hiện cơ chế “tiến hóa tự động”: mô hình tự vận hành hơn 100 vòng tối ưu, bao gồm phân tích các quỹ đạo thất bại, lập kế hoạch sửa đổi, chỉnh sửa kiến trúc mã của chính nó, chạy đánh giá, lặp lại, cuối cùng đạt mức tăng 30% về hiệu suất trên bộ dữ liệu đánh giá nội bộ. Trong 22 bài khó của MLE Bench Lite (đánh giá độ khó của cuộc thi học máy), M2.7 giành 9 huy chương vàng, 5 bạc, 1 đồng, tỷ lệ giành huy chương trung bình 66.6%.

Xét theo năm chiều, hai hướng đi hoàn toàn khác nhau: MiMo-V2-Pro vượt trội rõ rệt về độ dài ngữ cảnh và khả năng lập trình, còn M2.7 lại nổi bật về tự động hóa văn phòng và khả năng tự tiến hóa. Theo bài blog kỹ thuật của MiniMax, M2.7 đạt 1495 ELO trong đánh giá xử lý tài liệu văn phòng GDPval-AA, đứng đầu các mô hình mã nguồn mở, và duy trì tỷ lệ tuân thủ kỹ năng 97% trong hơn 40 kỹ năng phức tạp của bài kiểm tra MM-Claw.

Năm tháng, bốn phiên bản

Không chỉ khác về hướng công nghệ, nhịp độ cập nhật của hai công ty cũng hoàn toàn khác nhau.

Theo hồ sơ công khai, MiniMax từ tháng 10 năm 2025 ra mắt M2, đến tháng 3 năm 2026 ra mắt M2.7, trong vòng năm tháng đã cập nhật bốn phiên bản, trung bình mỗi 49 ngày một phiên lớn. Khoảng cách giữa M2.5 và M2.7 chỉ khoảng 30 ngày.

Trong khi đó, Xiaomi có nhịp độ khác: Tháng 4 năm 2025 ra mắt MiMo-7B (mô hình suy luận mở nguồn 7B tham số), tháng 12 cùng năm ra mắt V2-Flash (tổng tham số 309B), tháng 3 năm 2026 ra mắt V2-Pro (tổng tham số 1T). Mỗi thế hệ có quy mô tham số lớn hơn đáng kể, nhưng khoảng cách giữa các phiên cũng dài hơn.

MiniMax chọn lối đi nhỏ bước nhanh, mỗi lần cập nhật không lớn nhưng tần suất cực cao, cơ chế tự tiến hóa của M2.7 chính là để “liên tục tiến hóa”. Xiaomi chọn cách tích tụ sức mạnh, mỗi phiên bản là bước nhảy lớn về quy mô tham số và kiến trúc.

8 ngày ẩn danh, leo lên đỉnh OpenRouter

Ngoài hướng công nghệ, chiến lược phát hành của Xiaomi cũng phá vỡ quy chuẩn ngành.

Theo Reuters, ngày 11 tháng 3, một mô hình ẩn danh tên Hunter Alpha xuất hiện trên nền tảng tổng hợp API lớn nhất thế giới là OpenRouter. Không có thương hiệu, không có họp báo, không có blog kỹ thuật. Giá API của nó cực thấp, nhưng hiệu năng lại bất ngờ mạnh mẽ.

Cộng đồng bắt đầu đồn đoán nguồn gốc của nó. Theo Republic World và nhiều phương tiện truyền thông công nghệ, giả thuyết phổ biến nhất là DeepSeek V4, vì trưởng nhóm MiMo là Lô Phúc Lợi từng làm nghiên cứu tại DeepSeek. Lượng gọi API tăng nhanh, trong thời gian ẩn danh tổng cộng vượt 1 nghìn tỷ tokens, đứng đầu bảng xếp hạng tuần của OpenRouter.

Đến sáng ngày 19 tháng 3, Xiaomi công bố: Hunter Alpha chính là MiMo-V2-Pro. Theo Reuters, sau khi công bố, cổ phiếu của Xiaomi tại Hồng Kông đã tăng tối đa 5.8%.

Đây là lần đầu tiên mô hình lớn nội địa chứng minh khả năng của mình trên nền tảng toàn cầu bằng phương pháp blind test hoàn toàn. Không dựa vào thương hiệu, không dựa vào truyền thông, chỉ trong 8 ngày đã để các nhà phát triển “bỏ phiếu bằng chân”.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.