Elon Musk: Perbedaan antara Grok V9 dan V8 sangat besar, versi pelatihan V9 sudah menunjukkan performa yang lebih baik

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Pesan, 15 Mei (UTC+8), Elon Musk mengumumkan di platform X bahwa pelatihan terbaru Grok V9 (1,5T parameter) berjalan "sangat baik", dan hasil tersebut belum termasuk dalam pelatihan tambahan data Cursor. Versi model dasar yang sedang dikembangkan saat ini adalah V9, dengan skala parameter sekitar 1,5 triliun, yang secara signifikan meningkat dibandingkan V8 dalam hal pembersihan data, metode pelatihan, skala model, dan lainnya, serta telah dioptimalkan untuk arsitektur Blackwell guna meningkatkan efisiensi pemanfaatan daya komputasi. Musk menekankan bahwa, dibandingkan dengan itu, versi eksternal saat ini v4.2 dibangun berdasarkan model dasar V8, dengan skala parameter sekitar 0,5T, berjalan di arsitektur Hopper, dan masih memiliki keterbatasan dalam kualitas dan cakupan data pelatihan. Perbedaan kinerja antara Grok V8 dan V9 sangat besar, dan generasi model baru ini telah mencapai lompatan besar dalam kemampuan keseluruhan. (Sumber: ODAILY)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • 1
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
StardustUnderTheGlassDome
· 2jam yang lalu
Apakah tingkat ilusi V9 telah membaik, model besar bukan semakin besar semakin baik
Lihat AsliBalas0
SudoSage
· 6jam yang lalu
Kata "peningkatan lompatan" yang keluar dari mulut Elon Musk biasanya berarti ada sesuatu yang benar-benar penting
Lihat AsliBalas0
YieldKaraoke
· 7jam yang lalu
Masih menjalankan Hopper secara eksternal, internal sudah Blackwell, bermain dengan selisih informasi dengan paham
Lihat AsliBalas0
GateUser-53a6e1a8
· 7jam yang lalu
Pembersihan data akhirnya mendapatkan perhatian, sebelumnya kualitas balasan Grok memang sering naik turun
Lihat AsliBalas0
Don'tCallMeABagHolder.
· 7jam yang lalu
Optimisasi arsitektur Blackwell adalah fokus utama, peningkatan efisiensi penggunaan daya komputasi secara langsung menentukan apakah dapat menghasilkan keuntungan
Lihat AsliBalas0
LimeLeverageAlert
· 7jam yang lalu
Menunggu integrasi Cursor, skala parameter V9 ini agak di luar nalar
Lihat AsliBalas0
BlackVelvetBluePeony
· 7jam yang lalu
Penjelasan optimisasi Blackwell: Lao Huang dan Elon Musk semakin terikat erat.
Lihat AsliBalas0
Post-RainCancellationAgent
· 7jam yang lalu
0.5T ke 1.5T parameter tiga kali lipat, perbedaannya memang besar
Lihat AsliBalas0
  • Disematkan