Vercel:Jumlah panggilan Token DeepSeek melebihi OpenAI, biayanya hanya 1% dari total pengeluaran

robot
Pembuatan abstrak sedang berlangsung
ME AI Pesan, menurut pemantauan Beating, indeks produksi AI Gateway yang dirilis Vercel pada Juni 2026. Laporan menunjukkan, berkat peluncuran seri DeepSeek V4 (termasuk model Flash dan Pro) melalui Vercel Gateway pada Mei, pangsa lalu lintas Token DeepSeek meningkat dari kurang dari 1% menjadi 17% dalam satu bulan, melampaui OpenAI (13%) dan menempati posisi ketiga. Namun karena harga yang sangat rendah, total biaya penggunaan DeepSeek oleh semua pengguna hanya sekitar 1% dari total pengeluaran dana gateway. Harga adalah faktor utama di balik ledakan cepat DeepSeek. Biaya input dan output satu juta Token DeepSeek V4 Flash hanya sebesar 0,14 dolar dan 0,28 dolar, 20 hingga 50 kali lebih murah daripada model terdepan sejenis dari Anthropic, dan 8 hingga 12 kali lebih murah daripada Qwen 3.6 Plus dan Kimi K2.6. Penilaian menunjukkan bahwa performa DeepSeek V4 memenuhi standar, mendorong tim pengembang untuk dengan cepat menerapkannya dalam produksi. Meskipun lalu lintas model berbiaya rendah meningkat pesat, dari segi pengeluaran dana, model terdepan tetap mendominasi. Pengeluaran Anthropic pada Mei meningkat dari 61% menjadi 65%, dengan pengeluaran 70% hingga 80% di bidang aplikasi generasi, agen latar belakang, dan pemrograman yang kompleks. Misalnya, dalam skenario agen pemrograman, DeepSeek menyumbang 49% dari lalu lintas Token, tetapi hanya 4% dari biaya, sementara Anthropic menghabiskan 28% dari lalu lintas dan 70% dari dana. Tim pengembang mengelola anggaran melalui routing cerdas, mengalihkan tugas berfrekuensi tinggi dan risiko rendah ke model berbiaya rendah, hanya menggunakan model terdepan di bagian-bagian penting. Pertimbangan terhadap pengembalian investasi (ROI) juga memperlambat peningkatan model. Misalnya, Google merilis Gemini 3.5 Flash pada Mei dengan harga lebih tinggi dari versi 3.0, menyebabkan migrasi berjalan lambat, hingga akhir bulan 3.0 Flash masih menyumbang 90% dari lalu lintas seri Flash, sementara 3.5 Flash hanya 7%. Selain itu, agen AI menunjukkan tingkat konsumsi Token yang sangat tinggi, dengan satu dari empat permintaan menghabiskan lebih dari setengah Token. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan