Goldman Sachs: Apa arti DeepSeek V4 bagi AI di Tiongkok?

Penulis: Bao Yilong, Wall Street Journal

Goldman Sachs berpendapat, Makna inti dari DeepSeek V4 terletak pada mendukung penerapan aplikasi agen cerdas yang lebih kompleks dengan biaya yang lebih rendah, sehingga membuka ruang baru untuk skala aplikasi AI.

Pada 24 April, tim Ronald Keung dari Goldman Sachs mengeluarkan laporan riset, model V4 yang sepenuhnya open source ini merupakan kelanjutan dari jalur efisiensi dan open source dari DeepSeek.

Secara teknologi, V4 melalui peningkatan arsitektur secara besar-besaran menurunkan biaya jendela konteks panjang, dan secara tegas mengandalkan chip domestik Huawei. Secara pasar, peluncuran ini mempercepat kompetisi model AI di China yang semakin memanas, kemampuan pemrograman, tingkat penyelesaian tugas, dan multimodal akan menjadi pembeda utama dalam penetapan harga.

Goldman Sachs mempertahankan rekomendasi untuk sektor komputasi awan dan pusat data, peningkatan efisiensi biaya komputasi akan mendorong percepatan penetrasi aplikasi AI, pertumbuhan agen AI di perusahaan dan asisten AI di konsumen akan menjadi dua pendorong utama, yang akan mendukung peningkatan kemampuan penetapan harga layanan cloud secara berkelanjutan.

Peningkatan arsitektur V4, mendukung konteks lebih panjang dengan memori lebih sedikit

DeepSeek V4 dirilis dalam dua versi, Pro dan Flash.

Versi Pro adalah versi flagship, dengan jumlah parameter mencapai 1,6 triliun (parameter aktif 49 miliar); versi Flash relatif lebih ringan, dengan jumlah parameter 284 miliar (parameter aktif 13 miliar). Kedua model mendukung jendela konteks panjang hingga 1 juta kata token, setara dengan model top di AS (SOTA), tetapi memerlukan memori dan cache KV yang jauh lebih kecil.

Menurut laporan Goldman Sachs, V4 Pro dalam skenario konteks 1 juta, jumlah operasi floating point (FLOPs) yang dibutuhkan untuk inferensi token kata hanya 27% dari DeepSeek V3.2, dan cache KV hanya 10%; V4 Flash bahkan lebih agresif, FLOPs turun menjadi 10%, cache KV dikompresi hingga 7%.

Lompatan efisiensi ini didukung oleh tiga inovasi arsitektur utama:

  • Dalam mekanisme perhatian campuran, V4 memperkenalkan arsitektur gabungan antara perhatian jarang terkompresi (CSA) dan perhatian terkompresi berat (HCA). CSA melakukan kompresi urutan cache KV sebelum menghitung perhatian jarang, sementara HCA menggunakan kompresi yang lebih agresif namun mempertahankan perhatian padat, keduanya bekerja sama secara signifikan mengurangi memori sementara yang dibutuhkan untuk input panjang.

  • Dalam stabilitas pelatihan, V4 memperkenalkan mekanisme mHC, yang meningkatkan stabilitas transmisi informasi di berbagai lapisan jaringan;

  • Selain itu, menggunakan Muon sebagai optimizer utama pelatihan (beberapa modul tetap menggunakan AdamW), untuk menyesuaikan dengan arsitektur jaringan yang lebih kompleks dibanding V3, dan meningkatkan kualitas konvergensi selama pelatihan.

Goldman Sachs menunjukkan, peningkatan efisiensi ini sangat penting untuk skenario tugas jangka panjang, seperti agen yang harus memproses konteks dalam jumlah besar dalam siklus panjang.

Perlu dicatat bahwa saat ini DeepSeek masih fokus pada model teks dasar, sementara raksasa internet seperti Alibaba, ByteDance, MiniMax dan pemain model independen lebih cenderung ke jalur multimodal/semua modal, menunjukkan adanya divergensi yang jelas dalam jalur eksplorasi AGI.

Chip domestik mempercepat penerapan, Huawei Ascend 950 membuka ruang penurunan harga

Sinyal penting lain dari peluncuran V4 ini adalah bahwa DeepSeek secara tegas memasukkan produksi massal node super Huawei Ascend 950 ke dalam jalur komersialnya.

DeepSeek memperkirakan dengan realisasi pasokan besar-besaran dari node super Huawei Ascend 950 pada paruh kedua 2026, harga API versi V4 Pro akan mengalami penurunan signifikan.

Laporan Goldman Sachs menunjukkan, pernyataan ini memiliki dua makna:

Pertama, daya saing biaya DeepSeek akan semakin diperkuat, menciptakan kondisi untuk penerapan yang lebih luas; dan kedua, di tengah ketatnya pasokan chip, tren migrasi model AI top China ke komputasi domestik mendapatkan dukungan tegas dari pemain utama.

Dari harga saat ini, data Goldman Sachs menunjukkan bahwa harga V4 Pro di platform API utama sudah kompetitif, dan seiring peningkatan kapasitas pasokan komputasi domestik, keunggulan ini diperkirakan akan semakin besar pada paruh kedua 2026.

Persaingan model AI domestik memasuki tahap diferensiasi

Peluncuran open source DeepSeek V4 dengan cepat memicu gelombang baru di jalur model AI China.

Menurut Goldman Sachs, pemain yang baru-baru ini meluncurkan model baru meliputi: Kimi K2.6, Alibaba Qwen3.6-Max, Tencent Hy3 versi pratinjau, Xiaomi V2.5, dan MiniMax M3/Hailuo yang dijadwalkan rilis pada Mei.

Menurut Goldman Sachs, faktor diferensiasi utama yang akan menentukan hak penetapan harga model di masa depan akan berkisar pada dua dimensi:

Tingkat keberhasilan dalam pemrograman/penyelesaian tugas, di mana model GLM dari Zhipu berada di posisi terdepan;
Kemampuan multimodal, di mana ByteDance, Alibaba, dan MiniMax melakukan investasi paling mendalam.

Laporan riset menunjukkan, kedua tipe pemain ini memiliki keunggulan dan kelemahan yang jelas:

Pemain AI independen, seperti MiniMax, memiliki efisiensi organisasi tinggi dan rantai pengambilan keputusan yang singkat, sehingga meskipun harga API teks dasar sangat rendah, mereka tetap mampu mencapai margin kotor 40%, menurut prediksi Goldman Sachs.
Perusahaan besar internet, seperti ByteDance, Tencent, dan Alibaba, memiliki arus kas bisnis inti yang kuat, lebih cocok untuk mengembangkan infrastruktur AI dan jalur cloud, dan perlu menyiapkan skema insentif tim AI independen untuk mempertahankan talenta, misalnya tim Doubao dari ByteDance sudah memiliki insentif independen.

Perlu dicatat bahwa laporan Goldman Sachs mengutip berita bahwa Tencent dan Alibaba sedang menegosiasikan investasi di DeepSeek dengan valuasi lebih dari 20 miliar dolar AS, sementara Zhipu dan MiniMax memiliki valuasi pasar terbaru sekitar 53 miliar dolar dan 31 miliar dolar AS, yang menunjukkan bahwa potensi transaksi ini mencerminkan persaingan kekuatan besar dalam menguasai kemampuan AI tingkat tertinggi yang langka.

Logika jalur utama tetap: komputasi awan dan pusat data

Goldman Sachs mempertahankan pandangannya bahwa sektor utama untuk internet China tetap adalah komputasi awan dan pusat data, dengan alasan:

Permintaan token AI yang terus meningkat akan mendorong volume pengadaan layanan cloud;

Pertumbuhan pelanggan perusahaan dan agen AI akan meningkatkan kemampuan penetapan harga layanan cloud/token;

Penetrasi berkelanjutan dari asisten AI konsumen akan menambah kebutuhan tambahan.

Di pasar cloud perusahaan To-B, Alibaba memimpin dengan pendapatan cloud AI eksternal terbesar; di pasar konsumen To-C, ByteDance saat ini adalah platform dengan penggunaan token harian tertinggi untuk chatbot AI, dan aplikasi AIGC China secara keseluruhan menunjukkan pertumbuhan DAU yang kuat, dengan pertumbuhan bulanan sebesar 36% pada Maret 2026.

Dalam hal rekomendasi utama, Goldman Sachs terus menekankan empat saham inti: GDS, Century Internet, Alibaba, dan Kingsoft Cloud, sebagai fokus utama dalam memanfaatkan peluang ekspansi infrastruktur AI di China.

Selain itu, gelombang kedua adalah saham di jalur e-commerce dan perjalanan, dan gelombang ketiga adalah saham terkait model AI, sementara gelombang keempat adalah jalur game dan hiburan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan