Grok acabou de varrer as tabelas em várias plataformas de benchmarking de IA.
O modelo está agora no topo de oito tabelas de classificação diferentes: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode e Cline. É uma vitória limpa em alguns testes técnicos bastante exigentes.
No OpenRouter, o padrão continua. O Grok é atualmente o modelo de linguagem grande mais popular para consultas em inglês e lidera nas métricas de uso de tokens.
Essas classificações abrangem tudo, desde tarefas de programação até raciocínio científico, sugerindo que o desempenho do modelo é consistente em diferentes casos de uso, em vez de se destacar apenas em uma área restrita.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
10 Curtidas
Recompensa
10
9
Repostar
Compartilhar
Comentário
0/400
EternalMiner
· 4h atrás
Musk finalmente ganhou uma vez
Ver originalResponder0
MetaverseMortgage
· 5h atrás
Os dados são bastante reais.
Ver originalResponder0
HodlOrRegret
· 11-12 07:29
Os grandes modelos estão realmente a ficar loucos com a competição
Grok acabou de varrer as tabelas em várias plataformas de benchmarking de IA.
O modelo está agora no topo de oito tabelas de classificação diferentes: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode e Cline. É uma vitória limpa em alguns testes técnicos bastante exigentes.
No OpenRouter, o padrão continua. O Grok é atualmente o modelo de linguagem grande mais popular para consultas em inglês e lidera nas métricas de uso de tokens.
Essas classificações abrangem tudo, desde tarefas de programação até raciocínio científico, sugerindo que o desempenho do modelo é consistente em diferentes casos de uso, em vez de se destacar apenas em uma área restrita.