Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Tăng tốc tối đa gấp 3 lần và không mất mát, mô hình giải mã dự đoán MTP toàn bộ dòng của Google mã nguồn mở Gemma4
Theo giám sát Beating, Google đã phát hành và mã nguồn mở bản nháp của dòng mô hình dự đoán nhiều token (MTP) của Gemma 4. Đây là một mô hình phụ trợ nhẹ sử dụng kiến trúc giải mã dự đoán (speculative decoding), có thể tăng tốc suy luận tối đa gấp 3 lần dựa trên việc giữ lại quyền xác nhận cuối cùng của mô hình chính, mà không làm giảm chất lượng đầu ra và khả năng suy luận logic.
Mô hình ngôn ngữ lớn tiêu chuẩn mỗi lần chỉ có thể sinh ra một token, dễ bị giới hạn bởi băng thông bộ nhớ GPU và gây ra lãng phí tính toán. Giải pháp MTP cho phép mô hình nháp nhẹ tận dụng sức mạnh tính toán còn thừa, dự đoán trước một lần nhiều token tương lai, rồi gửi cho mô hình mục tiêu nặng như 31B để xác nhận song song. Nếu mô hình mục tiêu đồng ý với bản nháp, nó sẽ nhận toàn bộ chuỗi cùng lúc. Để nâng cao hiệu quả, mô hình nháp còn chia sẻ trạng thái kích hoạt và bộ đệm KV của mô hình mục tiêu (lưu trữ ngữ cảnh lịch sử để tránh tính toán lặp lại); đối với các mô hình E2B và E4B ở phía cuối, nhóm còn giới thiệu kỹ thuật phân cụm trong lớp nhúng.
Hiện tại, mô hình MTP đã được mở nguồn hoàn toàn theo giấy phép Apache 2.0 giống như Gemma 4, và hỗ trợ nguyên bản các framework suy luận phổ biến như vLLM, SGLang và Ollama. Việc tối ưu hóa tốc độ này đã giảm đáng kể rào cản ứng dụng, cho phép các nhà phát triển chạy mượt mà các mô hình MoE 26B và mô hình dày đặc 31B trên card đồ họa tiêu dùng thông thường, cũng như hỗ trợ tương tác AI thời gian thực trên thiết bị di động với mức tiêu thụ năng lượng thấp hơn.