В модели OpenClaw были опубликованы лучшие результаты работы Gemini 3 Flash

TestnetNomad · 2026-03-23T09:34:34+00:00

Петр Steinberger проанализировал производительность AI-моделей OpenClaw через результаты PinchBench, где Gemini 3 Flash занял первое место с показателем 95.1%. Другие модели также показали примечательные результаты, что демонстрирует потенциал для улучшения в области AI.

TestnetNomad

2026-03-23 09:34:34

Генерация тезисов в процессе

OpenClaw的创始人彼得·斯坦伯格最近分享了重要消息，成为AI行业关注的焦点。他们通过第三方独立机构PinchBench披露了AI系统性能的详细信息。

通过PinchBench展示的测试结果

根据1M AI News的报道，PinchBench是一个独立机构，分析各种大型语言模型（LLMs）的性能。在此次测试中，比较了OpenClaw代理在关键AI任务中的表现。

通过PinchBench分享的结果非常令人鼓舞。测试中，Google最新模型之一的Gemini 3 Flash取得了95.1%的成功率，位居第一。

模型性能差异

排名第二的是由Minimax开发的minimax-m2.1模型，成功率为93.6%。第三名是Moonshot AI的kimi-k2.5模型，成功率为93.4%。

其他知名模型的表现也值得关注。Anthropic的Claude Sonnet 4.5模型取得了92.7%的成功率，排名第四。广受欢迎的OpenAI GPT-4o模型在此次测试中以85.2%的成绩位列第五。

这些结果显示，不同的AI模型在各自特定任务中的提升空间仍然很大，每个模型在实现OpenClaw目标方面都具有自己的优势。

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .