Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 30 mô hình AI, với 0% phí bổ sung
Nghiên cứu viên của DeepMind suy đoán lý do hoãn DeepSeek V4: dữ liệu huấn luyện tăng gấp đôi lên 33T gây ra sự không ổn định nghiêm trọng
Theo giám sát Beating, báo cáo kỹ thuật của DeepSeek V4 tiết lộ rằng V4-Flash và V4-Pro lần lượt được tiền huấn luyện trên 32T và 33T tokens, gấp đôi so với khoảng 15T tokens của V3.
Báo cáo thừa nhận rằng trong quá trình huấn luyện đã gặp phải “những thách thức không ổn định đáng kể”, các đợt spike loss (tăng đột ngột của mất mát huấn luyện) lặp đi lặp lại, nguyên nhân là do các giá trị ngoại lai trong lớp MoE, cơ chế định tuyến còn làm gia tăng các giá trị ngoại lai này, việc quay trở lại đơn giản không thể giải quyết triệt để.
DeepSeek đã tìm ra hai phương án và đã áp dụng vào huấn luyện thực tế: Định tuyến dự đoán (Anticipatory Routing), tách riêng tính toán chỉ mục định tuyến khỏi cập nhật mạng chính, chỉ tự động kích hoạt khi phát hiện spike loss, chi phí bổ sung khoảng 20%; Chặn SwiGLU (SwiGLU Clamping), giới hạn giá trị kích hoạt trong phạm vi cố định để trực tiếp kiểm soát các giá trị ngoại lai.
Báo cáo cho biết cả hai đều có hiệu quả, nhưng thừa nhận “nguyên lý nền tảng vẫn chưa được hiểu rõ đầy đủ”.
Các nhà nghiên cứu của Google DeepMind, Susan Zhang (trước đây làm việc tại Meta AI và OpenAI), bình luận rằng sự không ổn định gây ra sau khi tăng gấp đôi dữ liệu huấn luyện “giải thích cho sự trì hoãn”, mô tả hai phương án này như “băng dán vết thương”, đồng thời khen ngợi độ minh bạch công nghệ của DeepSeek.