美团 menguji model parameter triliunan dalam skala besar secara terbuka, dengan pelatihan sepenuhnya dilakukan oleh klaster komputasi domestik.

robot
Pembuatan abstrak sedang berlangsung
AIMPACT berita, 24 April (UTC+8), menurut kabar industri, model dasar generasi baru Meituan LongCat-2.0-Preview telah dibuka untuk pengujian, total parameter model ini menembus triliun, masuk dalam jajaran model besar terkemuka global. Menurut sumber yang mengetahui, model besar V4 generasi baru yang dirilis DeepSeek pada hari yang sama memiliki total parameter dan parameter aktif yang pada dasarnya sama dengan LongCat-2.0-Preview milik Meituan. Selain skala parameter, terobosan lebih besar dari model dasar generasi baru Meituan adalah bahwa pelatihan dan inferensinya sepenuhnya bergantung pada klaster komputasi buatan dalam negeri. Menurut sumber tersebut, jumlah kartu komputasi yang digunakan dalam tahap pelatihan Meituan kali ini berkisar antara 50.000 hingga 60.000, dan ini juga merupakan tugas pelatihan model besar terbesar yang pernah diselesaikan dengan komputasi buatan dalam negeri sejauh ini. (Jiemian) (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan