Kecepatan produksi melambung 6 kali lipat! Bulan sisi gelap merilis Kimi K2.7 Code versi cepat, API menggunakan biaya ganda

Kode sumber menghasilkan jalur menuju badai petir! Unicorn AI yang unik, Moonshot AI, hari ini (15) secara resmi mengumumkan di akun komunitas resmi mereka peluncuran mode kecepatan tinggi baru — "Kimi K2.7 Code HighSpeed".
Mode ini membawa peningkatan kecepatan epik hingga 6 kali lipat, dengan output tugas konteks pendek yang melonjak hingga 260 token/detik. Saat ini fitur ini telah dibatasi secara bertahap dan terbatas untuk pengembang dan pengguna perusahaan, dengan harga API yang ditetapkan dua kali lipat dari versi standar.
(Prakata: Penilaian valuasi putaran pendanaan baru Moonshot AI mencapai 30 miliar dolar AS! Tiga putaran dalam enam bulan, Meituan sebagai investor utama, ARR satu bulan menembus 2 miliar dolar AS)
(Informasi tambahan: Bloomberg: China melarang keras unicorn AI menerima "dana AS"! ByteDance dan Moonshot AI semuanya disebutkan)

Daftar isi artikel

Toggle

  • Konteks pendek hingga 260 tok/detik! Efisiensi generasi meningkat enam kali lipat
  • Fokus pada biaya dua kali lipat! Harga API versi kecepatan tinggi terungkap
  • Kapasitas komputasi terbatas! Diluncurkan secara bertahap kepada perusahaan dan anggota rencana pengujian

Komunitas pengembang AI global menyambut revolusi efisiensi. Perusahaan besar model besar terkemuka Moonshot AI melalui akun resmi mereka @Kimi_Moonshot, hari ini (15) waktu Taipei secara resmi merilis versi super kecepatan tinggi dari model kode multimodal sumber terbuka mereka Kimi K2.7 Code — "Kimi K2.7 Code HighSpeed".

Secara bersamaan, mereka merilis video perbandingan samping (Side-by-Side) berdurasi 22 menit, yang secara visual menunjukkan perbedaan besar antara "mode kecepatan tinggi" dan "mode biasa" dalam output kursor di editor, pembuatan kode, pengolahan tabel Excel, serta tugas agen kompleks. Pihak resmi menegaskan, akses cerdas haruslah real-time dan ramah pengguna, tim akan terus mengoptimalkan untuk pengalaman pengembangan tanpa batasan geografis.

🌘 Temui Kimi K2.7 Code HighSpeed!
Mode kecepatan tinggi dari model kode multimodal sumber terbuka terbaru kami, Kimi K2.7 Code.

⚡️ Hingga 6× lebih cepat: Sekitar 180 tok/detik pada tugas pengkodean dengan input berukuran sedang, dan hingga 260 tok/detik pada tugas konteks lebih pendek.

🔷 Dirilis ke Beta Kimi Code… pic.twitter.com/syOOgIdtI4

— Kimi.ai (@Kimi_Moonshot) 15 Juni 2026

Konteks pendek hingga 260 tok/detik! Efisiensi generasi meningkat enam kali lipat

Berdasarkan spesifikasi teknologi terbaru yang diumumkan resmi, Kimi K2.7 Code HighSpeed mencapai evolusi kecepatan hingga 6 kali lipat secara keseluruhan. Dalam situasi operasional spesifik:

  • Tugas input berukuran sedang: kecepatan inferensi mode kecepatan tinggi stabil di sekitar 180 token/detik.
  • Konteks pendek (Short-context): kecepatan outputnya bisa melonjak hingga 260 token/detik yang mengagumkan.

Lompatan kecepatan ini berarti pengembang dapat melakukan debugging kode harian, auto-complete real-time, atau generasi kode multimodal visual hampir tanpa delay, secara signifikan meningkatkan efisiensi produksi perangkat lunak.

Fokus pada biaya dua kali lipat! Harga API versi kecepatan tinggi terungkap

Seiring peluncuran mode kecepatan tinggi, standar biaya yang paling banyak dipertanyakan pengembang pun terungkap. Berdasarkan pengungkapan komunitas dan bagian pengembang resmi, biaya API Kimi K2.7 Code HighSpeed secara lengkap dua kali lipat dari versi standar:

Dalam hal harga spesifik, biaya cache input mode kecepatan tinggi adalah 0,38 dolar AS per juta token, biaya cache miss adalah 1,90 dolar AS per juta token, dan biaya output utama adalah 8,00 dolar AS per juta token. Sebaliknya, versi standar Kimi K2.7 Code yang sudah open source hanya dikenai biaya 0,19 dolar, 0,95 dolar, dan 4,00 dolar per juta token. Meskipun ada kenaikan dua kali lipat, reaksi dari quant dan komunitas pengembang di Wall Street cukup positif, menganggap peningkatan performa real-time hingga 6 kali lipat ini sepadan dengan biaya tambahan tersebut.

Kapasitas komputasi terbatas! Diluncurkan secara bertahap kepada perusahaan dan anggota rencana pengujian

Moonshot AI mengakui, kapasitas komputasi (Capacity) yang dibutuhkan untuk inferensi kecepatan tinggi sangat terbatas, sehingga mode HighSpeed saat ini diluncurkan secara bertahap dan terbatas. Untuk menjaga kestabilan jaringan utama, mereka pertama kali membuka akses terbatas kepada anggota program beta Kimi Code, pengembang akun API Kimi, dan pengguna perusahaan Kimi Business.

Namun, pihak resmi menegaskan, "tidak memerlukan kode undangan tambahan" untuk pengujian ini. Pengembang yang berminat cukup mengajukan permohonan bergabung dalam program beta, dan akan mendapatkan akses secara bertahap dari sistem. Seiring dengan peningkatan infrastruktur Moonshot AI, mode kecepatan tinggi akan secara bertahap diperluas dan akhirnya dibuka untuk semua pengguna cloud publik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan