サイト「ビジュー・ニュース」では、OpenAIの研究者ノアム・ブラウンが意見を述べました。


彼は、AIモデルのパフォーマンス向上に伴い、モデルの品質を測る標準テストのスコアが、推論能力のコントロールに向かって徐々に進んでいることを指摘しています。
一定の固定スコアや単一のスコアは、強力なモデルの実際のレベルを反映しなくなり、今後の評価基準は、推論能力や生成されるトークン数に基づくパフォーマンスの曲線に変わるべきです。
新しいモデルGPT-5.5の例では、従来の初期テストではGPT-5.4と明確な優劣は見られませんでしたが、推論能力により多くのリソースを割り当てると、そのパフォーマンスは爆発的に向上し始めました。
ノアム・ブラウンは、現在の生物学的またはネットワークの安全性評価には、固定された推論予算が含まれていないことに警告しています。
国家レベルで対抗者が特定のミッションに100万ドル以上を投資した場合、かつて安全だと思われていたモデルも危険ラインを超える可能性があるのです。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし