Qwen3.7-Max chính thức ra mắt: Tự viết mã 1158 lần trong 35 giờ, rèn luyện bộ nhân tốc độ gấp 10 lần trên chip nội địa

robot
Đang tạo bản tóm tắt
Theo giám sát Beating, Alibaba Tongyi Qianwen chính thức ra mắt thế hệ nền tảng trí tuệ nhân tạo mới Qwen3.7-Max. Dữ liệu thực chiến do chính thức công bố cho thấy, trong một nhiệm vụ tối ưu hóa lõi hoàn toàn tự chủ kéo dài 35 giờ, vượt qua 1158 lần gọi công cụ, mô hình mới đã buộc nâng cao hiệu suất của bộ xử lý nội địa Zha Tongge Zhenwu M890 của nhà sản xuất Bạch Long lên 10.0 lần mà không cần tài liệu kiến trúc chip hay dữ liệu phân tích hiệu năng.

Trong quá trình tối ưu hóa, mô hình trải qua năm giai đoạn tiến hóa cốt lõi. Đầu tiên, nó phân chia bộ đệm tiền tố KV theo chiều token bằng phân vùng Split-K để lấp đầy 36 lõi SM; sau đó thay thế cudaMalloc đồng bộ giữa máy chủ và thiết bị bằng biến PyTorch được phân bổ trước, và bằng cách sử dụng metadata tensor hoàn toàn loại bỏ hành động cudaMemcpy đồng bộ khi truy vấn độ dài tiền tố, loại bỏ hoàn toàn chi phí giao tiếp giữa máy chủ và thiết bị; ở giai đoạn cuối, mô hình tái cấu trúc các phép toán để xử lý đồng thời tất cả 4 token truy vấn trong một khối luồng duy nhất, chia sẻ tải trọng truy cập bộ nhớ, hoàn thành việc tái cấu trúc đặc biệt cấp kiến trúc.

Thử nghiệm tối ưu hóa phép toán cho thấy, Qwen3.7-Max đạt tốc độ tăng trưởng trung bình 10.0 lần, vượt xa GLM 5.1 (7.3 lần) và Kimi K2.6 (5.0 lần). Trong khi đó, DeepSeek V4 Pro chỉ đạt 3.3 lần và trong nửa sau của quá trình, do không phát sinh bất kỳ lần gọi công cụ nào trong năm vòng liên tiếp, đã chủ động kết thúc nhiệm vụ sớm.

Để nắm bắt chiến lược giải quyết chung trong môi trường biến đổi, Qwen3.7-Max trong quá trình huấn luyện đã tách rời nhiệm vụ, khung chạy và bộ xác thực, và thông qua huấn luyện học tăng cường đa khung đã tránh được việc quá phù hợp với các tiêu chuẩn cụ thể. Trên các tiêu chuẩn trí tuệ chung MCP-Mark (điểm 60.8) và SpreadSheetBench (điểm 87.0), Qwen3.7-Max thể hiện khả năng tổng quát rất mạnh, hiệu suất tổng thể đã gần sát Claude-4.6-Opus-Max.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim