OpenClaw モデルに Gemini 3 Flash の優れたパフォーマンス結果が共有されました

robot
概要作成中

OpenClawの創設者ペーター・スタインバーガーは、最近AI業界の注目を集める重要なニュースを共有しました。彼は第三者の中立機関であるPinchBenchを通じて、自身のAIシステムの性能に関する詳細な情報を公開しました。

PinchBenchによる評価結果

1M AI Newsの報告によると、PinchBenchはさまざまな大規模言語モデル(LLMs)の性能を分析する独立組織です。今回のテストでは、OpenClawのエージェントタスクに関わる主要なAIモデルの比較が行われました。

PinchBenchが共有した結果は非常に励みになるものです。テストでは、Googleの最新モデルの一つであるGemini 3 Flashが95.1%の成功率を記録し、トップの座を獲得しました。

モデル間の性能差

ランキングの2位にはMinimaxが開発したminimax-m2.1モデルが入り、93.6%の成功率を示しました。3位はMoonshot AIのkimi-k2.5モデルで、93.4%の成功率を達成しています。

その他の著名なモデルの性能も注目に値します。AnthropicのClaude Sonnet 4.5モデルは92.7%の成功率を記録し、4位に位置しています。OpenAIのGPT-4oモデルは非常に有名で、このテストでは85.2%の成績を収めて5位となっています。

これらの結果は、さまざまなAIモデルがそれぞれの特定のタスクにおいてさらなる改善の余地があることを示しており、OpenClawの目標達成には各モデルの持つ強みが活かされていることを示しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.32K保有者数:1
    0.34%
  • 時価総額:$2.41K保有者数:2
    1.46%
  • 時価総額:$2.33K保有者数:2
    0.00%
  • 時価総額:$0.1保有者数:1
    0.00%
  • 時価総額:$2.3K保有者数:1
    0.00%
  • ピン