Thông Dịch Thiên Vấn mã nguồn mở Qwen3.6-27B, mô hình mã hóa dày đặc 27B vượt trội hơn so với thế hệ trước 397B flagship

robot
Đang tạo bản tóm tắt
Tin tức ME News, ngày 22 tháng 4 (UTC+8), theo theo dõi của Động Chấn Beating, nhóm Alibaba Tongyi Qianwen đã mở mã nguồn Qwen3.6-27B, một mô hình đa phương thức dày đặc 270 tỷ tham số, chủ yếu tập trung vào khả năng mã hóa agent. Đây là thành viên thứ ba trong dòng Qwen3.6 sau phiên bản API Qwen3.6-Plus và phiên bản MoE nhỏ kích thước Qwen3.6-35B-A3B, đã được phát hành trên Hugging Face và ModelScope. Điểm bán hàng cốt lõi là sử dụng kiến trúc dày đặc 27B để hoàn toàn vượt trội so với flagship mã nguồn mở thế hệ trước là Qwen3.5-397B-A17B (397B tổng tham số, mô hình MoE kích hoạt 17B). Trong tiêu chuẩn mã hóa agent, SWE-bench Verified đạt 77.2 so với 76.2, SWE-bench Pro đạt 53.5 so với 50.9, Terminal-Bench 2.0 đạt 59.3 so với 52.5, SkillsBench đạt 48.2 so với 30.0. Trong nhiệm vụ suy luận, điểm GPQA Diamond đạt 87.8, gần bằng nhiều lần tham số của các mô hình khác. Về mặt agent thị giác, điểm AndroidWorld đạt 70.3, cao hơn Qwen3.5-27B với 64.2. Mô hình nguyên bản hỗ trợ đầu vào hình ảnh và video, chế độ suy nghĩ và không suy nghĩ dùng chung một nhóm trọng số. Kiến trúc dày đặc không liên quan đến định tuyến MoE, triển khai dễ hơn so với MoE 397B. Tài liệu chính thức cho thấy có thể kết nối trực tiếp với ba công cụ mã hóa cuối cùng là OpenClaw, Claude Code và Qwen Code. API sẽ ra mắt trên nền tảng Bảo Luyện của Alibaba Cloud. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim