Dalam model OpenClaw, hasil kinerja terbaik dari Gemini 3 Flash dibagikan

robot
Pembuatan abstrak sedang berlangsung

OpenClaw의 창립자인 피터 슈타인버거는 최근 AI 산업에서 주목받는 중요한 소식을 공유했습니다. 그는 제3자 독립 기관인 PinchBench를 통해 자신의 AI 시스템 성능에 대한 상세 정보를 공개했습니다.

PinchBench를 통한 평가 결과

1M AI News의 보도에 따르면, PinchBench는 다양한 대형 언어 모델(LLMs)의 성능을 분석하는 독립 기관입니다. 이번 테스트에서는 OpenClaw의 에이전트가 수행하는 주요 AI 모델들을 비교했습니다.

PinchBench가 공개한 결과는 매우 고무적입니다. 테스트에서 Google의 최신 모델 중 하나인 Gemini 3 Flash는 95.1%의 성공률을 기록하며 1위를 차지했습니다.

모델 간 성능 차이

2위는 Minimax가 개발한 minimax-m2.1 모델로, 93.6%의 성공률을 보였습니다. 3위는 Moonshot AI의 kimi-k2.5 모델로, 93.4%의 성과를 냈습니다.

기타 유명 모델들도 주목할 만한 성과를 보였습니다. Anthropic의 Claude Sonnet 4.5 모델은 92.7%의 성공률로 4위에 올랐으며, OpenAI의 GPT-4o 모델은 85.2%로 5위에 자리했습니다.

이 결과들은 다양한 AI 모델들이 각자의 특정 작업에서 더 발전할 여지가 많음을 보여줍니다. 또한, OpenClaw의 목표 달성에 있어 각 모델마다 강점이 있음을 시사합니다.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan