Theo động thái Beating, Qwen3.7-Max chính thức ra mắt. Trong 35 giờ, với hơn 1158 lần gọi công cụ, tối ưu hóa nhân lõi hoàn toàn tự chủ, Việc thực hiện các phép tính của M890 Triton của Tongfu M890 đạt mức tăng 10 lần. Năm giai đoạn tối ưu hóa bao gồm phân vùng bộ đệm Split-K, thay thế cudaMalloc bằng biến đã phân bổ trước, Sử dụng siêu dữ liệu tensor để loại bỏ đồng bộ truy vấn tiền tố, xử lý song song 4 token truy vấn trong một khối đơn luồng để chia sẻ tải. Thử nghiệm cho thấy tăng tốc 10 lần, vượt qua GLM5.1, Kimi K2.6, DeepSeek V4 Pro chỉ đạt 3.3 lần và kết thúc mà không cần gọi công cụ sau này. Tách rời nhiệm vụ/khung framework/thiết bị xác thực, tăng cường học tập đa khung, Trên MCP-Mark, SpreadSheetBench có khả năng tổng quát mạnh, gần bằng Claude-4.6-Opus-Max.

BlockBeatNews

2026-05-20 03:36:50

Đang tạo bản tóm tắt

Theo giám sát Beating, Alibaba Tongyi Qianwen chính thức ra mắt thế hệ nền tảng trí tuệ nhân tạo mới Qwen3.7-Max. Dữ liệu thực chiến do chính thức công bố cho thấy, trong một nhiệm vụ tối ưu hóa lõi hoàn toàn tự chủ kéo dài 35 giờ, vượt qua 1158 lần gọi công cụ, mô hình mới đã buộc nâng cao hiệu suất của bộ xử lý nội địa Zha Tongge Zhenwu M890 của nhà sản xuất Bạch Long lên 10.0 lần mà không cần tài liệu kiến trúc chip hay dữ liệu phân tích hiệu năng.

Trong quá trình tối ưu hóa, mô hình trải qua năm giai đoạn tiến hóa cốt lõi. Đầu tiên, nó phân chia bộ đệm tiền tố KV theo chiều token bằng phân vùng Split-K để lấp đầy 36 lõi SM; sau đó thay thế cudaMalloc đồng bộ giữa máy chủ và thiết bị bằng biến PyTorch được phân bổ trước, và bằng cách sử dụng metadata tensor hoàn toàn loại bỏ hành động cudaMemcpy đồng bộ khi truy vấn độ dài tiền tố, loại bỏ hoàn toàn chi phí giao tiếp giữa máy chủ và thiết bị; ở giai đoạn cuối, mô hình tái cấu trúc các phép toán để xử lý đồng thời tất cả 4 token truy vấn trong một khối luồng duy nhất, chia sẻ tải trọng truy cập bộ nhớ, hoàn thành việc tái cấu trúc đặc biệt cấp kiến trúc.

Thử nghiệm tối ưu hóa phép toán cho thấy, Qwen3.7-Max đạt tốc độ tăng trưởng trung bình 10.0 lần, vượt xa GLM 5.1 (7.3 lần) và Kimi K2.6 (5.0 lần). Trong khi đó, DeepSeek V4 Pro chỉ đạt 3.3 lần và trong nửa sau của quá trình, do không phát sinh bất kỳ lần gọi công cụ nào trong năm vòng liên tiếp, đã chủ động kết thúc nhiệm vụ sớm.

Để nắm bắt chiến lược giải quyết chung trong môi trường biến đổi, Qwen3.7-Max trong quá trình huấn luyện đã tách rời nhiệm vụ, khung chạy và bộ xác thực, và thông qua huấn luyện học tăng cường đa khung đã tránh được việc quá phù hợp với các tiêu chuẩn cụ thể. Trên các tiêu chuẩn trí tuệ chung MCP-Mark (điểm 60.8) và SpreadSheetBench (điểm 87.0), Qwen3.7-Max thể hiện khả năng tổng quát rất mạnh, hiệu suất tổng thể đã gần sát Claude-4.6-Opus-Max.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
TradfiTradingChallenge
181.56K Phổ biến
#
30YearTreasuryYieldBreaks5%
357.29K Phổ biến
#
IsraelStrikesIranBTCPlunges
48.17K Phổ biến
#
#DailyPolymarketHotspot
999.99K Phổ biến
#
RWAMarketCapExceeds65Billion
8.75M Phổ biến

Đã ghim

sơ đồ trang web

Qwen3.7-Max chính thức ra mắt: Tự viết mã 1158 lần trong 35 giờ, rèn luyện bộ nhân tốc độ gấp 10 lần trên chip nội địa

Chủ đề thịnh hành

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Đã ghim