Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
CFD
Phái sinh CFD cổ phiếu Hoa Kỳ
Cổ phiếu Hoa Kỳ
Tiếp cận cổ phiếu và quỹ ETF thực của Hoa Kỳ
Cổ phiếu Hongkong
Giao dịch cổ phiếu chất lượng được niêm yết tại Hongkong
Cổ phiếu Hàn Quốc
SK Hynix
Giao dịch cổ phiếu Hàn Quốc thực và đầu tư vào các tài sản phổ biến
Futures cổ phiếu
Đòn bẩy cao, giao dịch 24/7
Cổ phiếu token hóa
Được hỗ trợ bởi tài sản cổ phiếu thực
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
GUSD
Đúc GUSD để nhận lợi suất từ RWA kho bạc
Hoạt động cổ phiếu
Giao dịch cổ phiếu phổ biến và nhận airdrop hấp dẫn
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
OpenAI công bố mã nguồn mở đánh giá khả năng giám sát chuỗi tư duy: CoT càng dài càng minh bạch, RL không dạy mô hình "giấu tâm tư".
Bộ này dùng để đo lường khả năng của mô hình giám sát trong việc phát hiện hành vi bất thường thông qua chuỗi suy luận (CoT, quá trình suy luận nội bộ mà mô hình tạo ra trước khi trả lời) của mô hình suy luận, bao gồm 13 bài đánh giá, 24 môi trường.
Đánh giá chia thành ba nguyên mẫu: Intervention (can thiệp, thay đổi đầu vào mô hình rồi xem mô hình giám sát có nhận thấy thay đổi hành vi không), Process (quy trình, xác minh các bước suy luận của mô hình có thực tế không), Outcome-property (thuộc tính kết quả, dự đoán từ dấu vết suy luận xem đầu ra có gian lận phần thưởng hay vi phạm an toàn không).
Phát hiện cốt lõi của bài báo: Giám sát CoT hiệu quả hơn chỉ giám sát hành động và đầu ra cuối cùng của mô hình; CoT càng dài thì khả năng giám sát càng cao; Huấn luyện RL ngay cả ở quy mô tiên tiến hiện tại cũng không làm giảm đáng kể khả năng giám sát.
Một phát hiện thực tế là, đối với các mô hình lớn có lực suy luận thấp, có thể thay thế bằng mô hình nhỏ hơn nhưng có lực suy luận cao hơn, vừa phù hợp năng lực vừa đạt được khả năng giám sát cao hơn, với cái giá là chi phí tính toán suy luận đắt hơn.
Ngoài ra, mở rộng sức mạnh tính toán suy luận của mô hình giám sát yếu có thể nâng cao hiệu quả giám sát mô hình mạnh, và việc cho mô hình giám sát yếu thấy CoT không chỉ tăng khả năng giám sát mà còn thúc đẩy xu hướng mở rộng này.
Thẻ hệ thống GPT-5.4 Thinking đã sử dụng bộ đánh giá này.
Kết quả cho thấy khả năng giám sát CoT tổng thể của GPT-5.4 Thinking thấp hơn một chút so với GPT-5 Thinking, nhưng không giảm toàn diện: trong kịch bản agentic misalignment (sai lệch căn chỉnh tác nhân) gần 100%, sự giảm tập trung vào các kịch bản cụ thể như truy vấn sức khỏe thiếu bằng chứng, sai lệch bộ nhớ và nhiệm vụ bất khả thi.
Sau khi điều tra, OpenAI cho rằng một phần sự hồi quy bắt nguồn từ hạn chế của bản thân bài đánh giá.
Kho lưu trữ đồng thời loại bỏ hai bài đánh giá Anti-Scheming và Memory, lý do là bài trước có sự không khớp giữa giám sát CoT chung và đánh giá câu trả lời dành riêng cho nhiệm vụ, bài sau có độ chính xác đánh giá câu trả lời không đủ.
(Nguồn: BlockBeats)