美团发布万亿参数大模型 LongCat-2.0,首个在国产算力集群完成全流程训练的万亿参数模型

robot
Pembuatan abstrak sedang berlangsung

深潮 TechFlow berita, 30 Juni - Menurut rilis resmi Meituan, Meituan secara resmi meluncurkan generasi baru model besar LongCat-2.0 dan membukanya secara bersamaan. Model ini memiliki total parameter 1,6T, merupakan model dengan parameter triliunan pertama di industri yang menyelesaikan pelatihan dan inferensi penuh pada cluster komputasi domestik 50.000 kartu, mendukung konteks ultra-panjang 1M secara asli, dan berfokus pada pemahaman, pembuatan, dan eksekusi kode dalam skenario Agentic Coding.

Dari segi teknis, LongCat-2.0 menggunakan mekanisme perhatian jarang LongCat Sparse Attention (LSA), yang mengurangi komputasi teks panjang dari kuadrat menjadi linear; melalui mekanisme ahli zero-computation, mencapai aktivasi dinamis tingkat token (33B~56B); dan memperkenalkan arsitektur MOPD yang menggabungkan tiga kelompok kemampuan ahli: Agent, Reasoning, dan Interaction. Dalam hal efisiensi pelatihan, tim telah mengatasi masalah adaptasi komputasi domestik selama tiga tahun, dengan tingkat kegagalan harian rata-rata bulanan turun lebih dari 70%, MFU pelatihan meningkat 1,5 kali lipat, dan throughput harian stabil lebih dari 1T token/hari.

Dalam hal evaluasi kinerja, LongCat-2.0 memperoleh skor 59,5 di SWE-bench Pro, melampaui Gemini 3.1 Pro (54,2), GPT-5.5 (58,6), dan Claude Opus 4.6 (57,3); memperoleh skor 79,9 di BrowseComp, mencapai level model tertutup terdepan.

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan