付款方式為

USD

支援 Visa、Mastercard、SEPA 等多種支付方式

靈活買賣幣，0手續費

加密貨幣付款卡，全球付款無憂

基礎交易

自由交易加密貨幣

借幣交易，放大收益

閃兌與定投

大小額通兌、0 費率、無滑點

自動調倉無懼強平，自帶槓桿放大收益

提前交易，先發制人

進階交易

使用 Gate 錢包進行鏈上交易

鏈上掘金，智選新幣

交易機器人

智能策略，自動交易

跟隨專家實現收益增長

一份保證金，跨平台共用

數百種永續合約市場

一站交易全球傳統資產

歐式 T 型報價，豐富的到期日和行權價

實現最大化資金效率

從零開始掌握合約交易技巧

參與活動贏取獎勵

使用模擬資金，無風險體驗真實交易

美股差價合約衍生品

參與真實美股市場，投資熱門股票與 ETF

參與真實港股市場，交易優質港股資產

交易真實韓股股票，投資熱門標的

高槓桿，7×24 全天候交易

錨定真實股票資產發行

打新自由，直通全球股票發行市場

鑄造 GUSD，賺取國債 RWA 收益

買賣熱門股票，解鎖豐厚空投

打新

參與活動賺糖果，贏超值空投獎勵

一鍵質押，賺取潛力新幣

持有 GT，免費領取海量空投

打新自由，直通全球股票發行市場

交易鏈上資產，享空投福利

合約交易得積分，空投獎勵待領取

理財產品

閒置代幣，隨時賺取收益

定期定額，讓理財變得更簡單

低買高賣，波動獲益

通過靈活質押資產獲取收益

抵押資產，即時借幣

一站式借貸入口

VIP 專屬理財

尊享理財訂製，助力財富增值

掌控未來財富主動權

頂尖量化，穩健護航

鏈上精選，質押賺幣

到期前不強平，安心持幣享槓桿收益

無需鎖倉，隨時交易提現

分享動態，發現價值

每日行情分析直播

隨時隨地與幣友即時交流

一站式獲取最新行業資訊

更多

推廣

參與活動，贏取豐厚獎勵

邀友入駐，共享高額收益

專屬返佣，輕鬆賺取高收益

擴大影響力，享海量空投

平台動態，實時更新

行業深度分析

超高費率折扣

提供一站式資產管理解決方案

提供企業級虛擬資產解決方案

開發者中心（API）

連接至 Gate 交易所的生態系統

OTC 銀行轉帳

提供多種法幣自營出入金渠道

經紀商專案

豐厚的 API 返佣機制

AI

您的對話式 AI 全能夥伴

在社交 App 中直接使用 Gate AI

Gate 藍龍蝦，開箱即用

Gate for AI Agent

AI 基礎設施，Gate MCP、Skills 與 CLI

Gate Skills Hub

從辦公到交易，一站式技能庫讓 AI 更好用

其他

常見問題解答與幫助指南

學習加密貨幣投資知識

與冠軍攜手同行

Gate 承諾 100%儲備金

守護您的資產安全

BinEval框架用是非題自動給AI打分，解決裁判模型虛報滿分和不透明痛點

2026-06-29 09:40:55

摘要生成中

币界網消息，BinEval框架透過是非題自動給AI打分，旨在解決裁判模型虛報滿分和不透明的問題。Capital One的研究團隊提出該框架，將複雜評分標準拆解為「是或否」單選題，確保評估模型逐一回答，最後用答對題目的比例計算得分。在三個主流數據集的測試中，使用Claude Sonnet 4等大模型的BinEval打分質量匹配或超越了Unieval等主流評估工具，特別擅長識別表面通順但事實錯誤的回答。以涉及飛機攔截的摘要評估為例，舊的AI裁判因只看表面，給了5.0的滿分，而BinEval透過七道是非題識別出四處事實錯誤，給出了1.57分，接近人類的2.0分。實驗表明，反饋優化能讓格式與句子結構的遵守率提升17個百分點，但對於限制字數等數學計算的硬實力，優化工具仍無能為力。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

3人按讚了這條動態

打賞
3
5
1
分享

回覆

請輸入回覆內容

請輸入回覆內容

L2 Night Courier

· 2小時前

17%格式提升不錯，但字數約束搞不定——感覺還是硬性規則好做，軟性理解難搞。

查看原文回復0

钱包权限管理员

· 2小時前

是非題設計確實聰明，把主觀打分變成可審計的客觀題，虛報空間直接壓縮。

查看原文回復0

Depeg Daydream

· 2小時前

多數據集接近或超越Unieval，這遷移能力有點東西，不是過擬合的玩具。

查看原文回復0

ForkingDrama

· 2小時前

1.57 vs 5.0 這個落差太真實了，表面流暢的幻覺文本終於能被揪出來。

查看原文回復0

马赛克蝴蝶结

· 2小時前

七道題拆解評估，比籠統的1-5分刻度精細多了，人類標註2.0說明方向對。

查看原文回復0

熱門話題
查看更多
#
TradFiCFD黃金大師賽
222.43萬熱度
#
Saylor暗示增持BTC
850.3萬熱度
#
預測世界盃巴西vs日本
49.09萬熱度
#
Solana生態ANSEM暴漲
2200.96萬熱度
#
USD1鏈上質押享年化7.66%
101.35萬熱度

已置頂