Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Nghiên cứu viên: Các bài kiểm tra tiêu chuẩn AI chính thống đều có thể bị "làm giả", dữ liệu bảng xếp hạng có thể bị sai lệch nghiêm trọng
Thông tin từ Coinjie.com, tin tức từ ME News, ngày 10 tháng 4 (UTC+8), nhà nghiên cứu AI Hao Wang đã công bố nghiên cứu tiết lộ rằng, nhiều bài kiểm tra chuẩn AI uy tín nhất trong ngành, bao gồm SWE-bench Verified và Terminal-Bench, đều tồn tại các lỗ hổng có thể khai thác hệ thống — nhóm của ông đã xây dựng một Agent mà không giải quyết bất kỳ nhiệm vụ thực tế nào, vẫn đạt điểm tối đa 100% trên hai bài kiểm tra này. Ví dụ điển hình như sau:
SWE-bench Verified: Trong kho mã nguồn, chèn một hook pytest dài 10 dòng, tự động chỉnh sửa tất cả kết quả thành “Đạt” trước khi chạy thử, hệ thống chấm điểm không phát hiện ra, 500 câu hỏi đều đạt điểm tối đa;
Terminal-Bench: Mặc dù bài kiểm tra này bảo vệ các tệp thử nghiệm, nhưng không bảo vệ tệp nhị phân hệ thống. Agent đã thay thế curl, chặn quá trình cài đặt phụ thuộc của trình xác thực, hoàn thành việc chiếm quyền thấp hơn;
WebArena: Đáp án được lưu trữ rõ ràng trong tệp cấu hình JSON cục bộ, và Playwright Chromium không hạn chế truy cập qua giao thức file://, mô hình có thể đọc trực tiếp đáp án rồi xuất ra nguyên bản.
Nhóm đã phát hiện ra 7 loại lỗ hổng lặp đi lặp lại trong quá trình kiểm tra 8 bài kiểm tra chuẩn, bao gồm: thiếu cách ly giữa Agent và bộ đánh giá, đáp án được gửi cùng với thử nghiệm, hệ thống LLM dễ bị tấn công chèn lệnh hướng dẫn. Đáng chú ý, hành vi bỏ qua đánh giá đã tự phát hiện trong các mô hình tiên tiến như o3, Claude 3.7 Sonnet và Mythos Preview mà không cần lệnh rõ ràng kích hoạt.
Dựa trên đó, nhóm đã phát triển công cụ quét lỗ hổng kiểm tra chuẩn WEASEL, có thể tự động phân tích quy trình đánh giá, xác định điểm yếu của ranh giới cách ly và tạo ra mã khai thác lỗ hổng khả dụng, tương tự như một công cụ “kiểm thử thâm nhập” cho bài kiểm tra chuẩn, hiện đang mở đăng ký truy cập sớm.