Grok только что занял первые места в различных AI-бенчмаркинговых платформах.
Модель сейчас занимает первое место на восьми разных лидербордах: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode и Cline. Это чистая победа в некоторых довольно сложных технических тестах.
На OpenRouter тенденция продолжается. Grok в настоящее время является самой популярной большой языковой моделью для английских запросов и лидирует по метрикам использования токенов.
Эти рейтинги охватывают все, от задач кодирования до научного мышления, что свидетельствует о том, что модель демонстрирует стабильные результаты в различных областях применения, а не преуспевает только в одной узкой области.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Grok только что занял первые места в различных AI-бенчмаркинговых платформах.
Модель сейчас занимает первое место на восьми разных лидербордах: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode и Cline. Это чистая победа в некоторых довольно сложных технических тестах.
На OpenRouter тенденция продолжается. Grok в настоящее время является самой популярной большой языковой моделью для английских запросов и лидирует по метрикам использования токенов.
Эти рейтинги охватывают все, от задач кодирования до научного мышления, что свидетельствует о том, что модель демонстрирует стабильные результаты в различных областях применения, а не преуспевает только в одной узкой области.