Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Thư viện toán tử GPU mã nguồn mở DeepSeek DeepGEMM có bản cập nhật lớn, thêm Mega MoE hợp nhất năm bước tính toán MoE thành một kernel duy nhất
Tin tức ME News, ngày 16 tháng 4 (UTC+8), theo theo dõi Beating của Động Chấn, DeepSeek hôm nay đã phát hành bản cập nhật lớn nhất kể từ khi mở nguồn DeepGEMM. Thư viện phép toán GPU này được phát hành trong “Tuần mở nguồn” vào tháng 2 năm ngoái, ban đầu chỉ hỗ trợ nhân ma trận FP8, nay đã mở rộng thành thư viện phép toán đầy đủ cho các bước quan trọng trong suy luận mô hình lớn, hỗ trợ các phép tính ma trận với nhiều độ chính xác như FP8, FP4, BF16, cùng các phép toán chuyên dụng như MoE và điểm số chú ý.
Cập nhật cốt lõi là Mega MoE. Kiến trúc MoE (Chuyên gia hỗn hợp) là nền tảng của các mô hình như DeepSeek V3, trong quá trình suy luận cần thực hiện lần lượt năm bước: phân phối EP, biến đổi tuyến tính lớp đầu tiên, kích hoạt SwiGLU, biến đổi tuyến tính lớp thứ hai, hợp nhất EP. Cách làm truyền thống là gọi năm kernel riêng biệt theo thứ tự, mỗi lần đều phải chờ bước trước hoàn thành và dữ liệu di chuyển trong bộ nhớ GPU. Mega MoE hợp nhất năm bước này thành một kernel, cho phép truyền thông NVLink và tính toán Tensor Core diễn ra đồng thời, tiết kiệm thời gian chờ đợi và di chuyển dữ liệu trung gian. Hiện chỉ hỗ trợ tổ hợp độ chính xác FP8×FP4, yêu cầu phiên bản PyTorch 2.9 trở lên, nhóm phát triển cho biết vẫn đang tối ưu hóa, dữ liệu so sánh hiệu suất sẽ được công bố sau.
Các cập nhật khác bao gồm: nhân ma trận hỗn hợp FP8×FP4, hỗ trợ phép tính điểm chú ý FP4 cho MTP lớn hơn (Indexer), PDL (Khởi động phụ thuộc theo chương trình, một tối ưu hóa lập lịch GPU giảm độ trễ khởi động kernel), tốc độ JIT biên dịch nhanh hơn, cùng nhiều tối ưu cho phép tính ma trận MoE. Bản cập nhật này cũng đã thích ứng với bố cục dữ liệu MoE của DeepEPv2.
Trong phần mô tả PR đặc biệt ghi rõ: “Bản phát hành lần này chỉ liên quan đến phát triển DeepGEMM, không liên quan đến phát hành mô hình nội bộ.”
(Nguồn: BlockBeats)