Grok щойно очолив чарти на кількох платформах для оцінювання AI.
Модель зараз займає перше місце на восьми різних рейтингах: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode та Cline. Це чиста перемога у деяких досить вимогливих технічних тестах.
На OpenRouter шаблон продовжується. Grok наразі є найпопулярнішою великою мовною моделлю для англійських запитів і лідирує за метриками використання токенів.
Ці рейтинги охоплюють усе, від завдань з кодування до наукового мислення, що вказує на те, що модель демонструє стабільну продуктивність у різних випадках використання, а не виділяється лише в одній вузькій області.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Grok щойно очолив чарти на кількох платформах для оцінювання AI.
Модель зараз займає перше місце на восьми різних рейтингах: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode та Cline. Це чиста перемога у деяких досить вимогливих технічних тестах.
На OpenRouter шаблон продовжується. Grok наразі є найпопулярнішою великою мовною моделлю для англійських запитів і лідирує за метриками використання токенів.
Ці рейтинги охоплюють усе, від завдань з кодування до наукового мислення, що вказує на те, що модель демонструє стабільну продуктивність у різних випадках використання, а не виділяється лише в одній вузькій області.