Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
CFD
Phái sinh CFD cổ phiếu Hoa Kỳ
Cổ phiếu Hoa Kỳ
Tiếp cận cổ phiếu và quỹ ETF thực của Hoa Kỳ
Cổ phiếu Hongkong
Giao dịch cổ phiếu chất lượng được niêm yết tại Hongkong
Cổ phiếu Hàn Quốc
SK Hynix
Giao dịch cổ phiếu Hàn Quốc thực và đầu tư vào các tài sản phổ biến
Futures cổ phiếu
Đòn bẩy cao, giao dịch 24/7
Cổ phiếu token hóa
Được hỗ trợ bởi tài sản cổ phiếu thực
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
GUSD
Đúc GUSD để nhận lợi suất từ RWA kho bạc
Hoạt động cổ phiếu
Giao dịch cổ phiếu phổ biến và nhận airdrop hấp dẫn
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Trung tâm tài sản VIP
Kế hoạch tăng trưởng tài sản cao cấp
Gate Wealth
Nắm quyền kiểm soát tương lai tài chính của bạn
Quỹ định lượng
Chiến lược định lượng hàng đầu
Staking
Stake tiền điện tử để kiếm tiền từ các sản phẩm PoS
Đòn bẩy thông minh
Đòn bẩy không thanh lý
USD1 Lãi 8%/năm
Không khóa, tự do giao dịch.
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
Perplexity công bố phương pháp huấn luyện hậu kỳ cho Agent tìm kiếm, mô hình dựa trên Qwen3.5 vượt qua GPT-5.4 về độ chính xác và chi phí.
Quy trình này dựa trên các mô hình mã nguồn mở Qwen3.5-122B-A10B và Qwen3.5-397B-A17B, áp dụng phương án hai giai đoạn: đầu tiên sử dụng tinh chỉnh có giám sát (SFT) để thiết lập các hành vi cần thiết khi triển khai như tuân thủ chỉ thị, nhất quán ngôn ngữ, sau đó dùng học tăng cường chính sách trực tuyến (RL) để tối ưu độ chính xác tìm kiếm và hiệu quả sử dụng công cụ.
Giai đoạn RL sử dụng thuật toán GRPO, dữ liệu huấn luyện bao gồm hai phần: một là bộ dữ liệu hỏi đáp có thể xác minh đa bước do tự nghiên cứu tổng hợp, bắt đầu từ truy vấn hạt giống nội bộ, xây dựng các câu hỏi yêu cầu suy luận từ 2 đến 4 bước thông qua chuỗi thực thể, và được xác minh tính duy nhất của câu trả lời bởi nhiều bộ giải độc lập; hai là dữ liệu hội thoại tổng quát dựa trên tiêu chí chấm điểm (rubric), chuyển đổi các yêu cầu triển khai như tuân thủ chỉ thị, ràng buộc định dạng thành các điều kiện nguyên tử có thể kiểm tra khách quan, dùng để ngăn chặn hành vi đã thiết lập bởi SFT bị suy thoái trong giai đoạn RL.
Cốt lõi của thiết kế phần thưởng là tổng hợp có cổng: chỉ khi đường cơ sở đúng (trả lời đúng câu hỏi hoặc đáp ứng đầy đủ tiêu chí chấm điểm), điểm ưu tiên mới được tham gia tính toán, ngăn chặn tín hiệu ưu tiên cao che lấp lỗi thực tế. Hình phạt hiệu suất áp dụng phương thức neo trong nhóm, lấy câu trả lời đúng trong cùng nhóm làm chuẩn, áp dụng hình phạt mượt cho số lần gọi công cụ và độ dài sinh vượt quá.
Đánh giá cho thấy Qwen3.5-397B-SFT-RL sau hậu huấn luyện đạt hiệu suất tốt nhất trên nhiều chuẩn tìm kiếm. Trên FRAMES, với một lần gọi công cụ đạt 57.3%, cao hơn GPT-5.4 5.7 điểm phần trăm, cao hơn Sonnet 4.6 4.7 điểm phần trăm. Với ngân sách trung bình (4 lần gọi công cụ) đạt 73.9%, chi phí mỗi truy vấn 2.0 xu Mỹ; trong cùng điều kiện, GPT-5.4 là 67.8% / 8.5 xu Mỹ, Sonnet 4.6 là 62.4% / 15.3 xu Mỹ.
Dữ liệu chi phí được tính theo giá API công khai của các nhà sản xuất, chưa bao gồm tối ưu hóa bộ nhớ đệm.
(Nguồn: BlockBeats)