جروك قد اجتاز المخططات عبر العديد من المنصات الخاصة بتقييم الذكاء الاصطناعي.
النموذج الآن في المركز الأول على ثمانية لوحات متصدرة مختلفة: BlackBox AI و Terminal-Bench Hard و GPQA Diamond و SciCode و AAII Token Usage و Roo Code و KiloCode و Cline. هذه هي سيطرة نظيفة على بعض الاختبارات الفنية القاسية.
في OpenRouter، يستمر النمط. Grok هو حاليًا النموذج اللغوي الكبير الأكثر شعبية للاستفسارات باللغة الإنجليزية ويتصدر في مقاييس استخدام الرموز.
تغطي هذه التصنيفات كل شيء من مهام البرمجة إلى التفكير العلمي، مما يشير إلى أن أداء النموذج ثابت عبر حالات الاستخدام المختلفة بدلاً من التميز في مجال ضيق واحد فقط.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
جروك قد اجتاز المخططات عبر العديد من المنصات الخاصة بتقييم الذكاء الاصطناعي.
النموذج الآن في المركز الأول على ثمانية لوحات متصدرة مختلفة: BlackBox AI و Terminal-Bench Hard و GPQA Diamond و SciCode و AAII Token Usage و Roo Code و KiloCode و Cline. هذه هي سيطرة نظيفة على بعض الاختبارات الفنية القاسية.
في OpenRouter، يستمر النمط. Grok هو حاليًا النموذج اللغوي الكبير الأكثر شعبية للاستفسارات باللغة الإنجليزية ويتصدر في مقاييس استخدام الرموز.
تغطي هذه التصنيفات كل شيء من مهام البرمجة إلى التفكير العلمي، مما يشير إلى أن أداء النموذج ثابت عبر حالات الاستخدام المختلفة بدلاً من التميز في مجال ضيق واحد فقط.