Mô hình mã nguồn mở đang bắt kịp, nhưng điều gì thực sự đang được bắt kịp?

robot
Đang tạo bản tóm tắt

Mở mã nguồn đang đuổi kịp, nhưng phải nói rõ là đuổi kịp đến đâu

Z.ai ra mắt GLM-5.1, Modal gần như ra mắt đồng thời với bản triển khai và dịch vụ lưu trữ. Hai việc chồng lên nhau, khiến việc nhìn riêng từng thứ không còn thú vị bằng.

Mô hình là 754B MoE (tham số hoạt động 40B). Điểm của SWE-Bench Pro là 58,4%; với các tác vụ mã hoá, hiệu suất tương đương với GPT-5.4 và Opus 4.6; có thể chạy đủ 8 giờ ở chế độ tự hành (autonomous mode), thực hiện vài nghìn lần lặp mà không bị sập. BenchLM hiện xếp thứ 10, trong khi KernelBench cho thấy nhanh hơn 3,6 lần so với các giải pháp mã nguồn mở trước đó.

Phản hồi trên mạng xã hội bị chia rẽ: Bindu Reddy nói đây là bằng chứng rằng mã nguồn mở đã đuổi kịp mã đóng; Victor Taelin lại nghi ngờ rằng “500+ tokens/s” ở độ chính xác FP8 là không thực tế, triển khai thật có thể chỉ khoảng 200 tps. Hai bên đều có lý—mô hình đúng là mạnh, nhưng các con số marketing có phần lạc quan.

Lần này có vài điểm khác so với các lần công bố mã nguồn mở trước đó:

  • Đầu mối miễn phí của Modal thay đổi thuật toán khả dụng và chi phí. Z.ai (tiền thân của Zhipu, hiện đã niêm yết tại Hồng Kông) tiếp cận các nhà phát triển phương Tây thông qua Modal, nên nhà phát triển không phải lo lắng về các xung đột địa chính trị; mức giá $1/triệu token đầu vào cũng đang hạ “neo” giá của dịch vụ độc quyền.
  • Việc quảng bá hiệu suất suy luận cần đặt trong ngữ cảnh. GLM-5.1 dùng sparse mixed attention (chú ý hỗn hợp thưa) và reinforcement learning bất đồng bộ để kiểm soát chi phí mở rộng. Nhưng “500+ tps” dựa trên một hạ tầng mà phần lớn mọi người không có. Nút thắt thật sự nằm ở việc thương mại hoá (dịch vụ hoá) và điều phối (scheduling), không nằm ở thông số kỹ thuật trên giấy của mô hình.
  • Có thể tích hợp trực tiếp vào chuỗi công cụ hiện có. Tương thích với Claude Code, OpenClaw, nghĩa là có thể thay thế trực tiếp vào luồng công việc độc quyền hiện có. Điều này tạo ra áp lực cho Anthropic và OpenAI chủ yếu về mặt giá cả, không phải năng lực bị san bằng.

MarkTechPost và Constellation đều diễn giải rằng sự “khác biệt 6 tháng” giữa mã nguồn mở và mã đóng đang được thu hẹp. Trong hướng tác nhân mã hoá (coding agent), nhận định này nhiều khả năng đúng. Z.ai dùng giấy phép MIT; việc tinh chỉnh (fine-tuning) thứ hai đã đang được triển khai.

Nhưng đừng vì thế mà nghĩ rằng mã nguồn mở đã lật kèo toàn diện. Mô hình độc quyền vẫn đang dẫn đầu đáng kể về căn chỉnh an toàn (safety alignment) và suy luận đa phương thức (multi-modal). Thứ đang bị xói mòn là “hào” trong kịch bản tác nhân mã hoá: doanh nghiệp trong các tác vụ này coi trọng chi phí triển khai hơn nhiều, nên không nhạy lắm với chênh lệch năng lực biên.

Quan trọng hơn cả mô hình là cơ sở hạ tầng

Modal dựa trên cụm B200, triển khai GLM-5.1 bằng SGLang, trong các tình huống tương tác có thể đạt 30–75 tokens/s. Những chi tiết kỹ thuật tưởng như khô khan này mới là điều thực sự quan trọng.

Z.ai khi trình diễn trên VectorDBBench đã cho thấy thông lượng 21,5k QPS (qua 600 lần tối ưu lặp). Hiệu năng này cần đến tính co giãn (elastic scaling) không máy chủ của Modal để giao ổn định; chỉ dựa vào bản thân mô hình thì không thể đạt mức đó.

Điều này cũng thay đổi cách chúng ta nhìn “việc ra mắt mô hình”: chúng không còn là sự kiện tách rời nữa mà là một phần của chiến lược hệ sinh thái. Tổ hợp “mô hình mã nguồn mở + hạ tầng phương Tây” trở thành một cách phòng vệ trước việc bị khoá vào API của một phòng thí nghiệm đơn lẻ.

Về các ranh giới của GLM-5.1: điểm benchmark cho mã hoá đạt 94,6% so với Opus, nhưng khoảng cách suy luận vẫn còn. Bức tranh năng lực “cân bằng” hơn có ý nghĩa hơn với các trường hợp sử dụng cụ thể.

Nhìn về phía trước: doanh thu của Z.ai năm ngoái tăng trưởng theo năm (YoY) là 131%. Nếu chi phí suy luận hạ xuống dưới $0.50/triệu tokens, mã nguồn mở có cơ hội trong vòng một năm giành được 30–50% phần chia thị trường triển khai tác nhân mã hoá. Những thay đổi trong chính sách của Mỹ có thể gây xáo trộn, nhưng rủi ro hiện tại trông có vẻ không cao.

Bên quan điểm Bằng chứng Tác động ngành Nhận định của tôi
Nhóm lạc quan về mã nguồn mở SWE-Bench Pro 58,4%, chạy tự hành 8 giờ Doanh nghiệp bắt đầu thử nghiệm thay thế mã nguồn mở Có phần phóng đại. Ưu thế nằm ở tích hợp và tính sẵn sàng, không nằm ở điểm số. Thử dùng miễn phí của Modal quan trọng hơn thứ hạng trên bảng xếp hạng.
Nhóm bảo hộ mã đóng BenchLM hạng 10, năng lực suy luận vẫn kém hơn Opus Mã đóng tiếp tục dẫn đầu về an toàn và đa phương thức Sai lệch về định giá. Hiệu suất của GLM làm nén quyền định giá của đối thủ, Anthropic phải phản hồi.
Nhóm thực dụng về hạ tầng Đầu mối Modal, tương thích OpenClaw Vốn tập trung vào nền tảng serverless Đây mới là mấu chốt. Dù mô hình nào thắng, các công ty hạ tầng đều được hưởng lợi.
Nhóm nghi ngờ địa chính trị Z.ai niêm yết ở Hồng Kông, giấy phép MIT, căng thẳng Trung-Mỹ Nguồn gốc mô hình sẽ bị soi xét nhiều hơn Tạm thời bị đánh giá cao. Chú ý khả năng kiếm tiền từ không gian giao dịch với các đối tác lưu trữ phương Tây thì thực tế hơn.

Kết luận: Tổ hợp lần này xác nhận một điều: trong lĩnh vực tác nhân mã hoá theo chiều dọc, năng lực của mã nguồn mở đã cơ bản theo kịp. Người được lợi là những Builder xây dựng kiến trúc “không phụ thuộc hạ tầng”, cũng như các nhà đầu tư đặt cược vào nền tảng lưu trữ. Anthropic đối mặt với áp lực về giá. Những doanh nghiệp vẫn gắn chặt với API mã đóng đang trả thêm phí cho việc năng lực đang bị thu hẹp dần.

Mức độ quan trọng: Cao
Phân loại: Ra mắt mô hình, hợp tác, mã nguồn mở

Nhận định: Với đường đua tác nhân mã hoá, hiện vẫn là một “cửa sổ” tương đối sớm. Hai nhóm người được hưởng lợi ưu tiên là: (1) Builder và bên tích hợp xây dựng luồng công việc không phụ thuộc hạ tầng; (2) những người nắm giữ/cược vào dòng tiền cho serverless hosting và các nền tảng suy luận. Giao dịch ngắn hạn chỉ có lợi thế nếu nắm bắt được nhịp điệu giảm giá và di chuyển lưu lượng; nhà đầu tư nắm giữ dài hạn cần theo dõi đường cong chi phí liệu có thật sự hạ xuống dưới $0.50/triệu tokens hay không, để kiểm chứng liệu phần thị trường có thể nhảy vọt hay không.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim