Xiaomi và MiniMax cùng ra đòn lớn, cuộc chiến định giá Agent chính thức bắt đầu

robot
Đang tạo bản tóm tắt

Ngày 18 và 19 tháng 3, hai công ty Trung Quốc lần lượt công bố các mô hình lớn hướng Agent của riêng mình. Công ty khởi nghiệp AI trong nước MiniMax ra mắt M2.7, đội ngũ mô hình lớn thuộc Xiaomi là MiMo giới thiệu V2-Pro. Cả hai mô hình đều lọt vào hàng đầu thế giới trên benchmark Agent, nhưng giá API đầu ra của chúng lần lượt là 1/21 và 1/8 của Claude Opus 4.6.

Hai công ty cùng ra mắt trong cùng một tuần, nhưng bộ bài của họ hoàn toàn khác nhau. Chúng đại diện cho hai hướng đi công nghệ hoàn toàn khác biệt, đặt cược vào hai tương lai của thời đại Agent.

Cùng kỳ thi, học phí 1/17

Hãy xem so sánh trực quan nhất.

Dựa trên dữ liệu từ OpenRouter và các trang giá chính thức của các công ty, tính theo giá API đầu ra (mỗi triệu tokens), MiniMax M2.7 là 1,2 USD, MiMo-V2-Pro là 3 USD. Để tham khảo, giá đầu ra của Claude Opus 4.6 là 25 USD, GPT-5.2 là 14 USD, Claude Sonnet 4.6 là 15 USD.

Khoảng cách về giá là về quy mô, nhưng khả năng không chênh lệch nhiều. Trên SWE-bench Verified (benchmark đo lường khả năng kỹ thuật mã nguồn hiện tại phổ biến nhất), MiMo-V2-Pro đạt 78%, Sonnet 4.6 là 79,6%, chênh lệch chưa đến hai phần trăm. M2.7 đạt 56,22% trên SWE-Pro, bằng với GPT-5.3-Codex. Trên VIBE-Pro (khả năng giao hàng dự án từ đầu đến cuối), M2.7 đạt 55,6%, gần bằng mức của Opus 4.6.

Điểm nhấn của biểu đồ này không nằm ở ai cao hơn ai — hệ thống benchmark của các bên không hoàn toàn đồng bộ, so sánh trực tiếp cần thận trọng. Điểm chính là sự "chênh lệch giá - hiệu năng" rõ rệt: mô hình Agent nội địa đã lọt vào cùng một dải khả năng, nhưng nằm trong các phân khúc giá hoàn toàn khác nhau.

Tỉ lệ nghịch của hàng nghìn tỷ tham số và tự tiến hóa

Chỉ là bề nổi của giá cả. Hai công ty đã đưa ra hai bộ bài hoàn toàn khác nhau.

MiMo-V2-Pro theo hướng "lực lớn tạo kỳ tích". Theo thông báo chính thức của Xiaomi, V2-Pro có hơn 1 nghìn tỷ tổng tham số, kích hoạt 42B tham số, hỗ trợ ngữ cảnh dài tới 1 triệu tokens. Đổi mới cốt lõi của nó là cơ chế Hybrid Attention, kết hợp tỷ lệ attention của cửa sổ trượt (SWA) và attention toàn cục (GA) là 7:1 — phiên bản trước là V2-Flash là 5:1. Cấu trúc này giúp mô hình ổn định hơn khi xử lý các tài liệu dài, nhiều công cụ đồng thời trong các tình huống Agent. Trên PinchBench (đánh giá khả năng gọi công cụ của Agent), MiMo-V2-Pro đạt 84%.

M2.7 theo một hướng hoàn toàn khác. Theo blog kỹ thuật chính thức của MiniMax ngày 18 tháng 3, số lượng tham số của M2.7 chưa được công bố, nhưng nó thể hiện một cơ chế "tiến hóa tự động": mô hình tự vận hành hơn 100 vòng tối ưu, bao gồm phân tích các đường dẫn thất bại, lập kế hoạch sửa đổi, chỉnh sửa kiến trúc mã của chính nó, chạy đánh giá, lặp lại, cuối cùng đạt được mức tăng 30% hiệu suất trên bộ dữ liệu đánh giá nội bộ. Trong 22 bài khó của MLE Bench Lite (đánh giá độ khó của cuộc thi học máy), M2.7 đạt 9 huy chương vàng, 5 bạc, 1 đồng, tỷ lệ đạt giải trung bình 66,6%.

Xem từ năm chiều, hai hướng đi hoàn toàn khác nhau: MiMo-V2-Pro rõ ràng vượt trội về độ dài ngữ cảnh và khả năng xử lý mã, còn M2.7 lại nổi bật về tự động hóa văn phòng và khả năng tự tiến hóa. Theo cùng bài blog kỹ thuật của MiniMax, M2.7 đạt 1495 điểm trên GDPval-AA (đánh giá xử lý tài liệu văn phòng), đứng đầu các mô hình mã nguồn mở, và duy trì tỷ lệ tuân thủ kỹ năng 97% trong hơn 40 kỹ năng phức tạp của bài kiểm tra MM-Claw.

Năm tháng bốn phiên bản

Không chỉ khác về hướng công nghệ, tốc độ cập nhật của hai công ty cũng hoàn toàn khác nhau.

Theo hồ sơ công khai, MiniMax từ tháng 10 năm 2025 ra mắt M2, đến tháng 3 năm 2026 ra mắt M2.7, trong vòng năm tháng đã cập nhật bốn phiên bản, trung bình mỗi 49 ngày một phiên lớn. Khoảng cách giữa M2.5 và M2.7 chỉ khoảng 30 ngày.

Trong khi đó, Xiaomi với MiMo có nhịp độ khác: tháng 4 năm 2025 ra mắt MiMo-7B (mô hình suy luận mở nguồn 7B tham số), tháng 12 cùng năm ra mắt V2-Flash (tổng tham số 309B), tháng 3 năm 2026 ra mắt V2-Pro (tổng tham số 1T). Mỗi thế hệ có quy mô tham số lớn hơn đáng kể, nhưng khoảng cách giữa các phiên cũng dài hơn.

MiniMax chọn lối đi nhỏ bước nhanh, mỗi lần cập nhật không lớn nhưng tần suất rất cao, cơ chế tự tiến hóa của M2.7 chính là để "liên tục tiến hóa". Xiaomi chọn cách tích tụ sức mạnh, mỗi phiên bản là bước nhảy lớn về quy mô tham số và kiến trúc.

Ẩn danh 8 ngày, lên đỉnh OpenRouter

Ngoài hướng đi công nghệ, chiến lược ra mắt của Xiaomi cũng phá vỡ quy chuẩn ngành.

Theo Reuters, ngày 11 tháng 3, một mô hình ẩn danh tên Hunter Alpha xuất hiện trên nền tảng tổng hợp API lớn nhất thế giới là OpenRouter. Không có thương hiệu, không có buổi ra mắt, không có blog kỹ thuật. Giá API của nó cực thấp, nhưng hiệu năng lại bất ngờ mạnh mẽ.

Cộng đồng bắt đầu đồn đoán về nguồn gốc của nó. Theo Republic World và nhiều phương tiện truyền thông công nghệ, giả thuyết phổ biến nhất là DeepSeek V4, vì trưởng nhóm MiMo là Luo Fuli từng làm nghiên cứu tại DeepSeek. Lượng gọi tăng nhanh, trong thời gian ẩn danh tổng gọi vượt 1 nghìn tỷ tokens, đứng đầu bảng xếp hạng tuần của OpenRouter.

Sáng ngày 19 tháng 3, Xiaomi công bố: Hunter Alpha chính là MiMo-V2-Pro. Theo cùng bài báo của Reuters, sau khi công bố, cổ phiếu của Xiaomi tại Hồng Kông đã tăng tối đa 5,8%.

Đây là lần đầu tiên mô hình lớn nội địa chứng minh khả năng của mình trên nền tảng toàn cầu bằng phương pháp thử nghiệm hoàn toàn mù quáng. Không dựa vào thương hiệu, không dựa vào quảng bá, chỉ trong 8 ngày đã để các nhà phát triển "bỏ phiếu bằng chân".

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim