広場
最新
注目
ニュース
プロフィール
ポスト
GateUser-e78067b2
2026-06-09 11:11:57
フォロー
サイト「ビジュー・ニュース」では、OpenAIの研究者ノアム・ブラウンが意見を述べました。
彼は、AIモデルのパフォーマンス向上に伴い、モデルの品質を測る標準テストのスコアが、推論能力のコントロールに向かって徐々に進んでいることを指摘しています。
一定の固定スコアや単一のスコアは、強力なモデルの実際のレベルを反映しなくなり、今後の評価基準は、推論能力や生成されるトークン数に基づくパフォーマンスの曲線に変わるべきです。
新しいモデルGPT-5.5の例では、従来の初期テストではGPT-5.4と明確な優劣は見られませんでしたが、推論能力により多くのリソースを割り当てると、そのパフォーマンスは爆発的に向上し始めました。
ノアム・ブラウンは、現在の生物学的またはネットワークの安全性評価には、固定された推論予算が含まれていないことに警告しています。
国家レベルで対抗者が特定のミッションに100万ドル以上を投資した場合、かつて安全だと思われていたモデルも危険ラインを超える可能性があるのです。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
GateIPOAccessSpaceX
6.62M 人気度
#
StrategyAdds1550BTCatLowerPrices
2.89M 人気度
#
IsraelStrikesIranBTCPlunges
56.79K 人気度
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.82M 人気度
#
PredictNBAChampionWin20000U
854.43K 人気度
ピン留め
サイトマップ
サイト「ビジュー・ニュース」では、OpenAIの研究者ノアム・ブラウンが意見を述べました。
彼は、AIモデルのパフォーマンス向上に伴い、モデルの品質を測る標準テストのスコアが、推論能力のコントロールに向かって徐々に進んでいることを指摘しています。
一定の固定スコアや単一のスコアは、強力なモデルの実際のレベルを反映しなくなり、今後の評価基準は、推論能力や生成されるトークン数に基づくパフォーマンスの曲線に変わるべきです。
新しいモデルGPT-5.5の例では、従来の初期テストではGPT-5.4と明確な優劣は見られませんでしたが、推論能力により多くのリソースを割り当てると、そのパフォーマンスは爆発的に向上し始めました。
ノアム・ブラウンは、現在の生物学的またはネットワークの安全性評価には、固定された推論予算が含まれていないことに警告しています。
国家レベルで対抗者が特定のミッションに100万ドル以上を投資した場合、かつて安全だと思われていたモデルも危険ラインを超える可能性があるのです。