Se compartieron los mejores resultados de rendimiento de Gemini 3 Flash en el modelo OpenClaw

TestnetNomad · 2026-03-23T09:34:34+00:00

Peter Stenberger ha analizado el rendimiento de los modelos de IA de OpenClaw a través de los resultados de PinchBench, donde Gemini 3 Flash ocupó el primer lugar con una tasa del 95.1%. Otros modelos también fueron notables, demostrando que existe potencial de mejora en la IA.

TestnetNomad

2026-03-23 09:34:34

Generación de resúmenes en curso

OpenClaw的创始人彼得·斯坦伯格最近分享了重要新闻，成为AI行业关注的焦点。他们通过第三方独立机构PinchBench披露了AI系统的详细性能信息。

通过PinchBench展示的测试结果

根据1M AI News的报道，PinchBench是一个独立机构，分析各种大型语言模型（LLMs）的性能。在此次测试中，比较了OpenClaw代理在关键AI任务中的表现。

通过PinchBench分享的结果非常令人鼓舞。测试中，Google最新模型之一的Gemini 3 Flash取得了95.1%的成功率，排名第一。

模型性能差异

排名第二的是由Minimax开发的minimax-m2.1模型，成功率为93.6%。第三名是Moonshot AI的kimi-k2.5模型，成功率为93.4%。

其他知名模型的表现也值得关注。Anthropic的Claude Sonnet 4.5模型成功率为92.7%，排名第四。广受欢迎的OpenAI GPT-4o模型在此次测试中取得85.2%，位列第五。

这些结果显示，不同的AI模型在各自特定任务中的提升空间仍然很大，每个模型在实现OpenClaw目标方面都具有自己的优势。

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.