OpenAI, ABD GSYİH'sine katkıda bulunan en üst 9 sektörden 44 meslek arasında 1,320 görev içeren, gerçek dünyada ekonomik olarak değerli görevlerde AI model performansını değerlendiren GDPval adlı bir ölçek geliştirdi.



Claude Opus 4.1, teslimatların %47.6'sının en iyi performans gösteren modeliydi.
View Original
post-image
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 6
  • Repost
  • Share
Comment
0/400
AlphaWhisperervip
· 16h ago
Yine bir veri yarışması, bıktım artık.
View OriginalReply0
FloorSweepervip
· 16h ago
zayıf alfa... gelenlerle bile uzaktan yakın değil
View OriginalReply0
SleepyArbCatvip
· 16h ago
Ha, bir gecelik MEV getirisi kadar bile değil.
View OriginalReply0
MultiSigFailMastervip
· 16h ago
Yarısından az geçiyor, sinir ağları çok işe yaramaz.
View OriginalReply0
ReverseTradingGuruvip
· 16h ago
gpt tamamen sayısal bir oyun
View OriginalReply0
StakeOrRegretvip
· 16h ago
Yine büyük kardeş en güçlü!
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)