Phân tích: Khoảng cách giữa các mô hình nguồn mở và mô hình đóng hàng đầu của Trung Quốc và Mỹ chỉ còn 3 đến 6 tháng, chi phí cực thấp thúc đẩy làn sóng thay thế toàn cầu.

robot
Đang tạo bản tóm tắt
Theo giám sát của Động Sát Beating, nhà cung cấp dịch vụ tổng hợp OpenRouter tiết lộ rằng khoảng cách hiệu suất giữa mô hình nguồn mở và mô hình tiên tiến đóng đã ổn định ở mức 3 đến 6 tháng. Trong 18 tháng qua, các phòng thí nghiệm đóng tiên tiến không thể tạo ra khoảng cách như kỳ vọng, trong khi lực lượng nguồn mở đại diện bởi các nhân vật mới từ Trung Quốc và Mỹ đang đẩy nhanh việc thay thế các mô hình đóng với tỷ lệ giá/hiệu suất cực cao.

DeepSeek V4 Flash chỉ sau hai tháng phát hành đã trở thành lựa chọn thay thế hàng đầu. DeepSeek V4 Flash với 284 tỷ tham số đạt 79.0% trong bài đánh giá SWE-bench Verified, hiệu suất gần với cấp độ GPT-5.5. Giá đầu vào/đầu ra chính thức của bên thứ nhất chỉ là 0,14/0,28 USD/triệu token, chi phí đầu ra rẻ hơn khoảng 150 lần so với GPT-5.5. Ngay cả khi cộng thêm phí đám mây phương Tây cho việc không giữ lại dữ liệu huấn luyện, chi phí thực tế chỉ khoảng 1,3% so với các mô hình đóng tiên tiến.

Ngoài lợi thế về giá, GLM 5.2 do Zhipu phát hành vào tháng 6 năm 2026 xếp hạng nhất trong Chỉ số Thông minh Trọng số Nguồn mở của Artificial Analysis, và trong đánh giá tác nhân thực tế, nó ngang bằng với cấp độ GPT-5.5, trở thành giải pháp thay thế cho lập trình kế hoạch dài hạn. Tuy nhiên, GLM 5.2 tiêu thụ nhiều token khi suy luận sâu, doanh nghiệp cần cân bằng chi phí đầu ra khi triển khai. Mô hình đa phương thức nguồn mở MiniMax M3, với kiến trúc chú ý thưa thớt MSA sáng tạo, cung cấp khả năng xử lý ngữ cảnh dài cho hình ảnh và video gốc với giá token thấp, trở thành đối thủ nguồn mở mạnh mẽ của Gemini Flash.

Đồng thời, Nemotron 3 Ultra của NVIDIA dựa trên kiến trúc lai Mamba-2 trở thành lực lượng nguồn mở mạnh nhất nội địa Mỹ, nhằm thúc đẩy nhu cầu thị trường cho phần cứng và hệ sinh thái dịch vụ vi mô của NVIDIA thông qua hệ sinh thái mở.

OpenRouter nhấn mạnh rằng mặc dù các mô hình đóng tiên tiến cuối cùng vẫn sẽ tiến về phía trước, nhưng chi phí token cho mức độ thông minh cố định sẽ tiếp tục giảm, mang lại không gian tối ưu hóa chi phí cho doanh nghiệp.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim