Coinworld News, ME News, March 14 (UTC+8). Recently, GPT-5.4 achieved a score of 75.0% on the OSWorld-Verified benchmark test, officially surpassing the human performance baseline. This benchmark test is designed to evaluate AI's ability to operate computer desktops using mouse and keyboard. Additionally, according to information, GPT-5.4 achieved a score of 83% on the GDPval test, which means that the model's performance on the vast majority of tasks has reached or exceeded the level of human professionals.

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン