Alibaba phát hành thế hệ mới của mô hình cơ bản Qianwen 3.5, đứng đầu toàn cầu về mô hình mã nguồn mở mạnh nhất

robot
Đang tạo bản tóm tắt

Vào ngày 16 tháng 2, ngày Giao thừa, Alibaba đã mở mã nguồn thế hệ mới của mô hình lớn Qwen3.5-Plus, hiệu năng sánh ngang Gemini 3 Pro, đứng đầu các mô hình mã nguồn mở mạnh nhất thế giới.

Theo thông tin, Qwen3.5 đã thực hiện đổi mới toàn diện kiến trúc mô hình nền tảng. Phiên bản Qwen3.5-Plus được phát hành lần này có tổng tham số là 3970 tỷ, chỉ kích hoạt 170 tỷ, hiệu năng vượt xa mô hình Qwen3-Max với hơn nghìn tỷ tham số, dung lượng bộ nhớ GPU cần để triển khai giảm 60%, hiệu quả suy luận tăng đáng kể, tối đa có thể tăng gấp 19 lần. Giá API của Qwen3.5-Plus chỉ còn 0,8 nhân dân tệ trên mỗi triệu token, chỉ bằng 1/18 của Gemini 3 Pro.

Khác với các thế hệ mô hình ngôn ngữ lớn trước đây của Qwen, Qwen3.5 đã đạt bước nhảy vọt từ mô hình thuần văn bản sang mô hình đa phương thức nguyên bản. Qwen3 được huấn luyện trên token văn bản thuần túy, còn Qwen3.5 dựa trên token kết hợp hình ảnh và văn bản, đồng thời bổ sung đáng kể dữ liệu tiếng Trung, tiếng Anh, đa ngôn ngữ, STEM và suy luận, giúp mô hình lớn “mở mắt” học hỏi kiến thức thế giới và logic suy luận phong phú hơn, đạt hiệu suất hàng nghìn tỷ của mô hình nền Qwen3-Max chỉ với chưa đến 40% tham số, thể hiện xuất sắc trong các bài kiểm tra toàn diện về suy luận, lập trình, trí tuệ nhân tạo Agent.

Vào ngày 15 tháng 1, ứng dụng Qwen đã ra mắt Agent mua sắm AI tiêu dùng đầu tiên trên thế giới. Trong dịp Tết Nguyên Đán, Agent mua sắm AI của Qwen đã giúp người dùng hoàn thành 1,2 tỷ đơn hàng trong 6 ngày, lần đầu tiên thực hiện thành công các nhiệm vụ thực tế quy mô lớn và xác thực thương mại toàn cầu. Với khả năng của Agent được nâng cao rõ rệt, Qwen3.5 sẽ mở rộng hơn nữa khả năng giúp đỡ người dùng trong công việc và cuộc sống qua ứng dụng Qwen.

Kể từ khi mở mã nguồn vào năm 2023, Alibaba đã mở mã hơn 400 mô hình Qwen, bao gồm các mô hình toàn kích cỡ và đa phương thức. Tải xuống toàn cầu của Qwen đã vượt 1 tỷ lần, lượng tải trong một tháng còn vượt cả tổng của DeepSeek, Meta, OpenAI, Zhipu, Kimi, MiniMax và các đối thủ khác, gấp từ 2 đến 8 lần. Các mô hình phát triển dựa trên Qwen đã vượt quá 200.000, trở thành mô hình mã nguồn mở hàng đầu thế giới được cộng đồng công nhận, và là mô hình mã nguồn mở thân thiện nhất dành cho các nhà phát triển. Đáp ứng nhu cầu của các nhà phát triển AI và doanh nghiệp ở các quốc gia khác nhau, mô hình lớn Qwen vẫn đang tiếp tục phát triển: Qwen3.5 mở rộng hỗ trợ 201 ngôn ngữ, từ điển từ vựng mở rộng từ 150.000 lên 250.000, tối đa có thể nâng cao hiệu quả mã hóa cho các ngôn ngữ ít người nói lên đến 60%.

Theo thông tin, ứng dụng Qwen và phiên bản PC đã tích hợp mô hình Qwen3.5-Plus ngay lập tức. Các nhà phát triển có thể tải mô hình mới từ cộng đồng MagicHub và HuggingFace, hoặc trực tiếp lấy dịch vụ API qua Alibaba Cloud Baille. Alibaba sẽ sớm tiếp tục mở mã nguồn các mô hình Qwen3.5 với các kích cỡ và chức năng khác nhau. Mô hình flagship Qwen3.5-Max có hiệu năng mạnh hơn cũng sẽ sớm ra mắt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim