AntBaiLing flagship Ling-2.6-1T dengan satu triliun parameter sumber terbuka: 630 juta aktivasi dari satu triliun parameter, lisensi MIT

robot
Pembuatan abstrak sedang berlangsung

Berita dari Jiema Network, Ant Group Bailing (Inclusion AI) secara resmi merilis sumber terbuka model flagship Ling-2.6-1T, dengan total parameter bobot sebanyak 1 triliun, setiap inferensi mengaktifkan 63 miliar (63B), menggunakan arsitektur MOE, panjang konteks 256K, dan lisensi MIT. Versi Flash dari model ini (104 miliar parameter / 7,4 miliar aktivasi) menonjolkan kecepatan dan ringan, sementara versi 1T dirancang untuk skenario tugas kompleks, menambahkan strategi pelatihan “Berpikir Cepat”, melalui pengenalan hadiah “Reduksi Redundansi Proses Konteks”, untuk mengompresi output rantai pemikiran yang panjang dan mengurangi konsumsi token. Dalam evaluasi, sertifikasi SWE-Bench mencapai 72,2% (versi Flash 61,2%), menunjukkan performa unggul dalam penilaian seperti AIME 2026, BFCL-V4, TAU2-Bench, IFBench, dan lainnya. Model ini kompatibel dengan kerangka utama Agent seperti Claude Code, OpenClaw, OpenCode, dan lain-lain, OpenRouter telah meluncurkan API gratis, dengan kebutuhan minimal 8 kartu GPU untuk deployment, mendukung SGLang dan VLLM.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan