DeepSeek V4 Dirilis beberapa hari setelah peluncurannya, di Silicon Valley terus memanas, juga menimbulkan beberapa diskusi masalah yang lebih tajam: efisiensi model, pola chip, waktu IPO, tekanan dari open source terhadap closed source.

Pada 29 April, vlog dari Silicon Valley 101 mengundang arsitek chip Xiao Zhibin dan mantan peneliti OpenAI Jenny Xiao, keduanya berbicara lebih dari satu jam, membahas seluruh kejadian ini secara tuntas.

Terlalu tertinggal oleh open source, nilai bisnis Anda menjadi nol

Pernyataan paling keras dalam diskusi adalah konsep yang diajukan Jenny tahun lalu—kill line (garis kematian), garis kematian yang digambar oleh model open source untuk perusahaan model dasar tertutup.

"Jika kamu adalah perusahaan model dasar dan kamu tertinggal oleh open source, nilai bisnis kamu pada dasarnya nol."

Jika kamu adalah perusahaan model dasar dan tertinggal oleh open source, nilai bisnis kamu langsung menjadi nol.

Ini bukan kompetisi teknologi, ini garis hidup dan mati.

Jenny memberi contoh Anthropic: jika suatu hari Claude tidak lagi menjadi model terbaik untuk pemrograman, siapa yang akan memakai Claude Code?

Mengikuti logika ini, pada 24 April saat DeepSeek V4 dirilis, semua saham dan valuasi perusahaan tertutup di Silicon Valley menghadapi pertanyaan mendalam: Apakah modelmu saat ini masih layak dijual dengan harga ini?

Harga menjadi indikator paling langsung:

GPT-5.5 lebih mahal dua kali lipat dari GPT-5.4, versi Pro teks panjang seharga 180 dolar per juta token.

Pada hari yang sama, DeepSeek V4 dirilis. Dengan input 1 yuan per juta token, output 24 yuan per juta token. Versi Flash lebih ekstrem: input 0.2 yuan per juta token, output 2 yuan per juta token.

Satu dua kali lebih mahal, satu sepuluh kali lebih murah.

Valuasi perusahaan model dasar bersifat dua kutub—Alasan keberadaanmu adalah model yang paling kuat. Jika tidak lagi yang terkuat, valuasi langsung nol. Bahkan jika kamu bernama OpenAI.

Uang terlalu banyak, malah tidak hemat

Jenny membongkar satu kenyataan yang tidak berani dihadapi Silicon Valley:

"Perusahaan Silicon Valley punya uang terlalu banyak, malah tidak termotivasi untuk mengoptimalkan efisiensi. Perusahaan model di China didorong sumber daya, lebih dulu masuk inovasi efisiensi token."

Keterbatasan sumber daya, justru menjadi akselerator inovasi.

OpenAI sejak hari pertama percaya pada prinsip "move fast, break things," membeli GPU secara bebas, membangun infrastruktur secara gila-gilaan. Sebaliknya, Anthropic lebih terkendali, takut pendapatan tidak cukup, biaya pengadaan menghambat.

Hasilnya? Dengan pendapatan yang sama, efisiensi modal Anthropic jauh lebih tinggi daripada OpenAI.

Lebih rumit lagi, OpenAI juga berjuang di beberapa lini: departemen hardware, chip buatan sendiri, aplikasi belanja, sementara pengalaman utama ChatGPT malah tidak optimal. Sejak akhir tahun lalu, proyek sampingan dipangkas satu per satu, termasuk Sora.

Para investor pun berubah pola pikir. Dulu melihat perusahaan AI sebagai "kurva pertumbuhan eksponensial, terus investasi." Sekarang yang mereka tanyakan:

"Kalau investasi lagi 1 miliar, 10 miliar, apa manfaat marginalnya? ROI-nya di mana?"

Jawaban dari DeepSeek sangat langsung: melanjutkan ROI dari perluasan infrastruktur mungkin sudah tidak menguntungkan lagi.

Inovasi selalu dipaksa keluar. Harga murah sendiri adalah prasyarat revolusi teknologi.

Setiap revolusi industri, yang mendorong perubahan bukan hanya seberapa hebat teknologinya, tetapi seberapa murah teknologi itu. Hanya yang murah sampai bisa digunakan orang biasa, teknologi benar-benar bisa mengubah dunia.

Tanpa efisiensi, AGI cuma demo

Zhao Zhibin setelah membaca makalah V4 berpendapat: "Arah sudah sesuai, tingkat penyelesaian teknik justru di luar dugaan."

Semua optimisasi teknologi V4 sebenarnya mengarah ke satu sasaran—token efficiency (efisiensi token).

Ia menggunakan tiga pendekatan:

• Optimizer Muon: sebagian modul pelatihan menggantikan Adam tradisional, mempercepat konvergensi

Ketiga hal ini bersatu, mengarah ke satu hasil: biaya pembuatan setiap token lebih rendah, setiap inferensi memakan memori lebih sedikit.

Biaya komputasi turun menjadi 1/3 dari model di Silicon Valley, penggunaan memori hanya 1/10.

Namun, yang benar-benar membuat orang berpikir keras dari V4 jauh lebih dari sekadar "menghemat uang."

Jenny berulang kali mengingatkan dalam diskusi: di era chatbot, konsumsi token terbatas, model yang lebih mahal pun pengguna bisa tahan. Tapi di era Agent, logika sama sekali berbeda—pemecahan tugas panjang, pemanggilan banyak alat, refleksi dan perencanaan berulang, konsumsi token bisa 10 sampai 100 kali lipat dari chatbot.

Jika setiap token harganya tidak murah, model tidak akan mampu berpikir mendalam dalam waktu lama, apalagi melayani pengguna secara massal.

Oleh karena itu, dia mengucapkan kalimat penetapan:

Tanpa efisiensi, AGI cuma demo. Dengan efisiensi, AGI bisa menjadi produk nyata.

Di era Agent, efisiensi sendiri adalah bagian dari kecerdasan.

Mengapa Anthropic bisa melampaui hingga 1 triliun? Fokus > Segala Sesuatu

Dalam waktu ini, valuasi Anthropic melampaui OpenAI, naik ke 1 triliun dolar.

Jenny menyebutkan tiga alasan, tapi intinya hanya lima kata: Fokus > Segala Sesuatu.

Pertama, Claude Code.

Mengapa Claude Code menjadi "momen penentu" bagi Anthropic?

Model-model Anthropic selalu bagus, tapi Claude Code adalah produk yang benar-benar mendorong pendapatan. Pendiri OpenClaw, Peter Steinberger, menulis artikel: "Claude Code adalah komputer saya."

Begitu model bisa menulis kode, bisa melakukan tugas umum—memperbarui CRM, meneruskan email, otomatisasi proses, semuanya berbasis kode.

Judgment Jenny sangat tajam: Pemrograman adalah langkah terpenting menuju AGI. Siapa yang menguasai pemrograman, berpotensi menjadi pemain dominan di era AGI.

Kedua, kepercayaan perusahaan.

Klien perusahaan di dana Jenny berulang kali mengatakan hal yang sama: memilih Anthropic karena ada janji keamanan. Ditambah lagi, kasus gugatan Anthropic terhadap Pentagon, memberi sinyal positif kepada perusahaan.

Ketiga, tidak melakukan hal yang tidak perlu.

OpenAI ingin menjadi "semua untuk semua orang," tapi hasilnya garis pertempuran tersebar, kehilangan keunggulan teknologi. Anthropic fokus pada tiga lini: keamanan, perusahaan, pemrograman.

Investor Silicon Valley percaya pada satu prinsip: Pendapatan perusahaan lebih utama daripada pendapatan konsumsi. Pendapatan dari perusahaan sangat terkonsentrasi, ini adalah cerita yang paling disukai pasar modal AS.

Nvidia: Keamanan jangka pendek, pasar inferensi jangka panjang pasti akan terpecah

Mengenai chip, saat ini semua merasa DeepSeek sedang "mengurangi ketergantungan pada Nvidia."

Tapi kenyataannya lebih rinci.

Tahap pelatihan: Pelatihan pra besar-besaran V4 tentu dilakukan di cluster Nvidia besar. Pada halaman 16 dan 20 laporan teknis V4, disebutkan TCGenO5 dan operator kunci seperti MegaMoE², semuanya sangat terkait ekosistem CUDA.

Tahap adaptasi: Huawei Ascend mengklaim "adaptasi dan pelatihan ulang/ inferensi 0-day," AMD mengklaim "integrasi optimasi di ROCm."

Perhatikan kata kunci—"adaptasi."

Ini berarti, model sudah dilatih dan difinalisasi di cluster Nvidia. Ascend dan AMD hanya melakukan "interkoneksi" menggunakan software mereka sendiri setelah pelatihan selesai. Ini adalah kompatibilitas mundur, bukan pengganti asli.

Dari sudut pandang ini, dalam jangka pendek, Nvidia memiliki benteng pelindung di sisi pelatihan yang cukup dalam. Ekosistem CUDA bukan sesuatu yang bisa dipindahkan dalam satu atau dua tahun.

Tapi dalam jangka panjang? Pasar inferensi memang mulai bergeser.

Setelah V4 menurunkan biaya perhatian konteks panjang, ambang besar untuk inferensi skala besar jadi jauh lebih rendah. Inferensi tidak lagi soal "siapa yang punya GPU lebih banyak, dia menang," melainkan "siapa yang arsitekturnya cocok, dia menang." Google TPU, AMD, chip buatan sendiri dari penyedia cloud, bahkan kekuatan komputasi domestik, semua mencari peluang di jalur ini.

Sinyal "80/20" yang bikin Silicon Valley sulit tidur

Dalam portofolio investasi Jenny, ada data: 80% tugas dijalankan di model open source kecil-menengah. Hanya 20% tugas paling kompleks yang memakai model tertutup.

Setahun lalu, tidak ada yang percaya rasio ini.

Sekarang, di Silicon Valley setiap hari muncul info seperti: "Kami punya saham OpenAI senilai 10 juta dolar, apakah dana kalian membelinya? Atau kenal siapa yang membelinya?"

Pada episode terakhir Silicon Valley 101 tanggal 29 April, Jenny menutup dengan satu kalimat yang memberi kejelasan:

"DeepSeek seperti pistol yang diarahkan ke punggung perusahaan model di Silicon Valley. Jika perusahaan-perusahaan ini tidak cukup cepat, DeepSeek akan mengejar dan menghancurkan bisnis mereka secara total."

Pistol ini sudah terisi peluru.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
SummerCreationCamp
1,46M Popularitas
#
IsraelStrikesIranBTCPlunges
75,14K Popularitas
#
EventContractsLive
130,99K Popularitas
#
BrentReturnsTo100
1,55M Popularitas
#
IntelQ2RevenueSurges25%
406,15K Popularitas

Disematkan

peta situs

DeepSeek pistol ini sudah menempel di belakang kepala Silicon Valley

Terlalu tertinggal oleh open source, nilai bisnis Anda menjadi nol

Uang terlalu banyak, malah tidak hemat

Tanpa efisiensi, AGI cuma demo

Mengapa Anthropic bisa melampaui hingga 1 triliun? Fokus > Segala Sesuatu

Nvidia: Keamanan jangka pendek, pasar inferensi jangka panjang pasti akan terpecah

Sinyal "80/20" yang bikin Silicon Valley sulit tidur

Topik Trending

SummerCreationCamp

IsraelStrikesIranBTCPlunges

EventContractsLive

BrentReturnsTo100

IntelQ2RevenueSurges25%

Disematkan