Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Muon âm thầm "đói chết" 25% các neuron: Sau khi Aurora sửa chữa, hiệu quả dữ liệu tăng gấp trăm lần
Theo theo dõi Beating Monitoring, Tilde Research phát hiện ra rằng bộ tối ưu hóa Muon được sử dụng trong các mô hình hàng đầu như DeepSeek V4, Kimi K2.5, GLM-5 có một nhược điểm tiềm ẩn: nó khiến hơn một phần tư các neuron trong lớp MLP chết vĩnh viễn trong giai đoạn đầu của quá trình huấn luyện. Nhóm đã thiết kế bộ tối ưu hóa thay thế mang tên Aurora và mở mã nguồn. Một mô hình 1.1B chỉ dùng khoảng 100B token đã đạt điểm ngang bằng trên các chuẩn đánh giá hiểu ngôn ngữ như HellaSwag, Winogrande so với Qwen3-1.7B được huấn luyện với 36T token.
Vấn đề nằm ở đặc tính toán học của Muon khi xử lý ma trận trọng số MLP. Trong giai đoạn đầu của huấn luyện, một số neuron tình cờ nhận được tín hiệu gradient yếu hơn. Các bộ tối ưu truyền thống như AdamW sẽ chuẩn hóa theo từng tham số, tự nhiên làm phẳng sự khác biệt này; nhưng bước chính xác của Muon sẽ giữ nguyên tín hiệu yếu đó. Các neuron yếu liên tục nhận được cập nhật yếu, ngày càng im lặng, tạo thành vòng lặp chết “người mạnh tiếp tục mạnh”. Đến bước 500 của quá trình huấn luyện, đã có hơn một phần tư neuron thực chất đã chết, lãng phí dung lượng tham số.
Phiên bản cải tiến trước đó là NorMuon đã cố gắng giảm thiểu vấn đề bằng cách ép cập nhật mỗi hàng theo cùng một mức độ, nhưng điều này phá vỡ tính chính xác của ma trận cập nhật (việc chính xác hóa giúp mỗi bước cập nhật hiệu quả nhất có thể, là lợi thế cốt lõi của Muon), dẫn đến mất độ chính xác tối ưu. Aurora kết hợp “cập nhật đều” và “tính chính trực” thành các ràng buộc liên kết, sử dụng phương pháp lặp xen kẽ để đồng thời thỏa mãn cả hai: vừa đảm bảo mỗi neuron có cơ hội học tập công bằng, vừa không làm giảm độ chính xác của cập nhật.
Aurora chưa tinh chỉnh tham số chỉ tiêu tốn nhiều hơn Muon 6% tính toán, có thể thay thế trực tiếp. Trong các thử nghiệm tối ưu hóa của modded-nanoGPT, Aurora đã phá vỡ kỷ lục hiện tại sau 3175 bước. Ưu điểm của Aurora còn tăng lên khi mở rộng độ rộng của MLP, hệ số mở rộng càng cao, cải thiện càng rõ rệt.
Mã nguồn và mô hình tiền huấn luyện 1.1B đã được mở nguồn.