OpenAI推出了GDPval,這是一個基準,評估AI模型在現實世界中經濟價值任務上的表現,涵蓋了來自美國GDP貢獻前9個行業的44個職業中的1,320個任務。



Claude Opus 4.1 是表現最好的模型,交付物的達成率爲 47.6%
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
AlphaWhisperervip
· 17小時前
又是一個數據比賽,玩膩了
查看原文回復0
FloorSweepervip
· 17小時前
弱阿爾法……遠未接近即將到來的情況
查看原文回復0
睡不醒的套利猫vip
· 17小時前
哈 還不如一個夜晚的MEV收益率
查看原文回復0
多签失败大师vip
· 18小時前
不到一半及格 神經網路太廢物了
查看原文回復0
反向指标先生vip
· 18小時前
gpt都是數字遊戲
查看原文回復0
StakeOrRegretvip
· 18小時前
還是老大哥最強!
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)