У моделі OpenClaw поділилися найкращими результатами роботи Gemini 3 Flash

robot
Генерація анотацій у процесі

Засновник OpenClaw Пітер Штайнбергер нещодавно поділився важливими новинами, які привернули увагу в індустрії штучного інтелекту. Він розкрив детальну інформацію про продуктивність своєї системи AI через незалежну третю сторону організації PinchBench.

Результати, оприлюднені через PinchBench

За даними звіту AI News, PinchBench — це незалежна організація, яка аналізує продуктивність різних великих мовних моделей (LLMs). У цьому тесті порівнювалися всі основні моделі AI, включені в агентські завдання OpenClaw.

Результати, оприлюднені через PinchBench, дуже обнадійливі. У тестуванні Gemini 3 Flash, один із найновіших моделей Google, досяг 95,1% успішності і зайняв перше місце.

Відмінності у продуктивності між моделями

На другому місці — модель minimax-m2.1, розроблена Minimax, з показником успішності 93,6%. Третє місце посідає модель kimi-k2.5 від Moonshot AI з результатом 93,4%.

Результати інших відомих моделей також вражають. Модель Claude Sonnet 4.5 від Anthropic показала 92,7% успішності і зайняла четверте місце. Модель GPT-4o від OpenAI, дуже популярна, у цьому тесті набрала 85,2% і посіла п’яте місце.

Ці результати свідчать про те, що у різних моделей AI ще є значний потенціал для покращення у своїх конкретних завданнях, і кожна модель має свої сильні сторони для досягнення цілей OpenClaw.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити