В модели OpenClaw были опубликованы лучшие результаты работы Gemini 3 Flash

robot
Генерация тезисов в процессе

OpenClaw的创始人彼得·斯坦伯格最近分享了重要消息,成为AI行业关注的焦点。他们通过第三方独立机构PinchBench披露了AI系统性能的详细信息。

通过PinchBench展示的测试结果

根据1M AI News的报道,PinchBench是一个独立机构,分析各种大型语言模型(LLMs)的性能。在此次测试中,比较了OpenClaw代理在关键AI任务中的表现。

通过PinchBench分享的结果非常令人鼓舞。测试中,Google最新模型之一的Gemini 3 Flash取得了95.1%的成功率,位居第一。

模型性能差异

排名第二的是由Minimax开发的minimax-m2.1模型,成功率为93.6%。第三名是Moonshot AI的kimi-k2.5模型,成功率为93.4%。

其他知名模型的表现也值得关注。Anthropic的Claude Sonnet 4.5模型取得了92.7%的成功率,排名第四。广受欢迎的OpenAI GPT-4o模型在此次测试中以85.2%的成绩位列第五。

这些结果显示,不同的AI模型在各自特定任务中的提升空间仍然很大,每个模型在实现OpenClaw目标方面都具有自己的优势。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.32KДержатели:1
    0.34%
  • РК:$2.41KДержатели:2
    1.46%
  • РК:$2.33KДержатели:2
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.3KДержатели:1
    0.00%
  • Закрепить