Thông Dịch Thiên Vấn mã nguồn mở Qwen3.6-27B, mô hình dày đặc 27B có khả năng mã hóa vượt xa mẫu cờ 397B thế hệ trước

robot
Đang tạo bản tóm tắt
Tin ME News, ngày 22 tháng 4 (UTC+8), theo theo dõi của Động Chác Beating, nhóm Alibaba Tongyi Qianwen đã mở mã nguồn Qwen3.6-27B, một mô hình đa phương thức dày đặc 270 tỷ tham số, chủ yếu tập trung vào khả năng mã hóa agent. Đây là thành viên thứ ba trong dòng Qwen3.6 sau phiên bản API Qwen3.6-Plus và phiên bản MoE kích thước nhỏ MoE Qwen3.6-35B-A3B, đã được phát hành trên Hugging Face và ModelScope. Điểm nổi bật chính là sử dụng kiến trúc dày đặc 27B để hoàn toàn vượt trội so với flagship mã nguồn mở thế hệ trước là Qwen3.5-397B-A17B (397B tổng tham số, mô hình MoE kích hoạt 17B). Trong các bài kiểm tra mã hóa agent, SWE-bench Verified đạt 77.2 so với 76.2, SWE-bench Pro 53.5 so với 50.9, Terminal-Bench 2.0 59.3 so với 52.5, SkillsBench 48.2 so với 30.0. Trong các nhiệm vụ suy luận, điểm GPQA Diamond đạt 87.8, gần bằng nhiều lần tham số của các mô hình khác. Về mặt agent thị giác, điểm AndroidWorld đạt 70.3, cao hơn Qwen3.5-27B với 64.2. Mô hình nguyên bản hỗ trợ đầu vào hình ảnh và video, chế độ suy nghĩ và không suy nghĩ dùng chung một nhóm trọng số. Kiến trúc dày đặc không liên quan đến định tuyến MoE, triển khai dễ hơn so với MoE 397B. Tài liệu chính thức cho thấy có thể kết nối trực tiếp với ba công cụ mã hóa cuối cùng là OpenClaw, Claude Code và Qwen Code. API sẽ ra mắt trên nền tảng Bảo Luyện của Alibaba Cloud. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim