Grok 4.20 Reasoning menduduki peringkat pertama dalam pengujian standar penalaran BridgeBench

robot
Pembuatan abstrak sedang berlangsung

ME News Berita, 15 April (UTC+8), berdasarkan pengumuman WesRoth di media sosial, model Reasoning Grok 4.20 menduduki peringkat pertama dalam benchmark penalaran BridgeBench yang sangat kompetitif. Model ini berhasil mengalahkan pesaing utama termasuk GPT-5.4 dari OpenAI, Claude Opus 4.6 dari Anthropic dengan 1 juta token, dan sebuah model dari Google. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan