Grok acaba de arrasar en las listas de varias plataformas de evaluación de IA.
El modelo ahora ocupa el primer lugar en ocho tablas de líderes diferentes: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode y Cline. Eso es un barrido limpio de algunas pruebas técnicas bastante exigentes.
En OpenRouter, el patrón continúa. Grok es actualmente el modelo de lenguaje grande más popular para consultas en inglés y lidera en métricas de uso de tokens.
Estos rankings cubren todo, desde tareas de codificación hasta razonamiento científico, sugiriendo que el rendimiento del modelo es consistente en diferentes casos de uso en lugar de destacarse en solo un área específica.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
10 me gusta
Recompensa
10
9
Republicar
Compartir
Comentar
0/400
EternalMiner
· hace4h
Musk finalmente ganó una vez
Ver originalesResponder0
MetaverseMortgage
· hace5h
Los datos son bastante reales.
Ver originalesResponder0
HodlOrRegret
· 11-12 07:29
Los modelos grandes realmente están enloqueciendo con la competencia
Grok acaba de arrasar en las listas de varias plataformas de evaluación de IA.
El modelo ahora ocupa el primer lugar en ocho tablas de líderes diferentes: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode y Cline. Eso es un barrido limpio de algunas pruebas técnicas bastante exigentes.
En OpenRouter, el patrón continúa. Grok es actualmente el modelo de lenguaje grande más popular para consultas en inglés y lidera en métricas de uso de tokens.
Estos rankings cubren todo, desde tareas de codificación hasta razonamiento científico, sugiriendo que el rendimiento del modelo es consistente en diferentes casos de uso en lugar de destacarse en solo un área específica.