Stepwise Ascent Cosmos sepenuhnya sumber terbuka Step 3.5 Flash: Kerangka pra-pelatihan + pelatihan sepenuhnya dirilis, naik ke posisi Top 2 OpenClaw

robot
Pembuatan abstrak sedang berlangsung

Perusahaan startup model besar Tiongkok, Zhaoyue Xingchen, setelah membuka sumber Model Step 3.5 Flash, kembali merilis bobot pra-pelatihan dari model dasar Agent (Base), bobot pelatihan tengah (Midtrain), serta kerangka pelatihan Steptron yang terkait. Diketahui bahwa Step 3.5 Flash menggunakan arsitektur MoE jarang, dengan total parameter 196 miliar, tetapi saat inferensi hanya mengaktifkan sekitar 11 miliar parameter, dengan kecepatan inferensi hingga 350 TPS untuk tugas kode permintaan tunggal. Model ini dirancang khusus untuk skenario Agen, menunjukkan performa yang luar biasa dalam inferensi kompleks dan tugas rantai panjang, dan dikatakan mampu menyamai kedalaman inferensi beberapa model tertinggi tertutup. Hingga saat ini, model ini telah diunduh lebih dari 300.000 kali di Hugging Face dan menduduki peringkat pertama Trending OpenRouter. Di proyek sumber terbuka terkenal OpenClaw (disebut “Udang Karang” oleh pengguna Tiongkok), peringkat model ini telah naik ke posisi kedua. (Laporan Harian Board of Science and Technology)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan