Grok baru saja menyapu tangga lagu di berbagai platform pengujian AI.
Model ini kini duduk di posisi teratas di delapan papan peringkat yang berbeda: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode, dan Cline. Itu adalah kemenangan bersih dari beberapa ujian teknis yang cukup menuntut.
Di OpenRouter, pola ini berlanjut. Grok saat ini adalah model bahasa besar yang paling populer untuk kueri dalam bahasa Inggris dan memimpin dalam metrik penggunaan token.
Peringkat ini mencakup segala hal mulai dari tugas pemrograman hingga penalaran ilmiah, menunjukkan bahwa kinerja model tersebut konsisten di berbagai kasus penggunaan daripada unggul hanya di satu area yang sempit.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Grok baru saja menyapu tangga lagu di berbagai platform pengujian AI.
Model ini kini duduk di posisi teratas di delapan papan peringkat yang berbeda: BlackBox AI, Terminal-Bench Hard, GPQA Diamond, SciCode, AAII Token Usage, Roo Code, KiloCode, dan Cline. Itu adalah kemenangan bersih dari beberapa ujian teknis yang cukup menuntut.
Di OpenRouter, pola ini berlanjut. Grok saat ini adalah model bahasa besar yang paling populer untuk kueri dalam bahasa Inggris dan memimpin dalam metrik penggunaan token.
Peringkat ini mencakup segala hal mulai dari tugas pemrograman hingga penalaran ilmiah, menunjukkan bahwa kinerja model tersebut konsisten di berbagai kasus penggunaan daripada unggul hanya di satu area yang sempit.