OpenClawの創設者ペーター・スタインバーガーは、最近AI業界の注目を集める重要なニュースを共有しました。彼は第三者の中立機関であるPinchBenchを通じて、自身のAIシステムの性能に関する詳細な情報を公開しました。## PinchBenchによる評価結果1M AI Newsの報告によると、PinchBenchはさまざまな大規模言語モデル(LLMs)の性能を分析する独立組織です。今回のテストでは、OpenClawのエージェントタスクに関わる主要なAIモデルの比較が行われました。PinchBenchが共有した結果は非常に励みになるものです。テストでは、Googleの最新モデルの一つであるGemini 3 Flashが95.1%の成功率を記録し、トップの座を獲得しました。## モデル間の性能差ランキングの2位にはMinimaxが開発したminimax-m2.1モデルが入り、93.6%の成功率を示しました。3位はMoonshot AIのkimi-k2.5モデルで、93.4%の成功率を達成しています。その他の著名なモデルの性能も注目に値します。AnthropicのClaude Sonnet 4.5モデルは92.7%の成功率を記録し、4位に位置しています。OpenAIのGPT-4oモデルは非常に有名で、このテストでは85.2%の成績を収めて5位となっています。これらの結果は、さまざまなAIモデルがそれぞれの特定のタスクにおいてさらなる改善の余地があることを示しており、OpenClawの目標達成には各モデルの持つ強みが活かされていることを示しています。
OpenClaw モデルに Gemini 3 Flash の優れたパフォーマンス結果が共有されました
OpenClawの創設者ペーター・スタインバーガーは、最近AI業界の注目を集める重要なニュースを共有しました。彼は第三者の中立機関であるPinchBenchを通じて、自身のAIシステムの性能に関する詳細な情報を公開しました。
PinchBenchによる評価結果
1M AI Newsの報告によると、PinchBenchはさまざまな大規模言語モデル(LLMs)の性能を分析する独立組織です。今回のテストでは、OpenClawのエージェントタスクに関わる主要なAIモデルの比較が行われました。
PinchBenchが共有した結果は非常に励みになるものです。テストでは、Googleの最新モデルの一つであるGemini 3 Flashが95.1%の成功率を記録し、トップの座を獲得しました。
モデル間の性能差
ランキングの2位にはMinimaxが開発したminimax-m2.1モデルが入り、93.6%の成功率を示しました。3位はMoonshot AIのkimi-k2.5モデルで、93.4%の成功率を達成しています。
その他の著名なモデルの性能も注目に値します。AnthropicのClaude Sonnet 4.5モデルは92.7%の成功率を記録し、4位に位置しています。OpenAIのGPT-4oモデルは非常に有名で、このテストでは85.2%の成績を収めて5位となっています。
これらの結果は、さまざまなAIモデルがそれぞれの特定のタスクにおいてさらなる改善の余地があることを示しており、OpenClawの目標達成には各モデルの持つ強みが活かされていることを示しています。