Produsen memori mengalami penurunan harga ratusan miliar, apakah hasilnya hanya kesalahan saja?

Bermain saham chỉ cần melihat riset analis Golden Kirin, berwenang, profesional, tepat waktu, komprehensif, membantu Anda menggali peluang bertema yang berpotensi!

(Sumber: NetEase Technology)

Kalau bukan karena Google TurboQuant yang bikin keributan seperti ini, saya bahkan tidak menyangka bahwa kami sudah menahan AI begitu lama.

Pada tanggal 24 bulan ini, Google Research tiba-tiba memposting tulisan yang secara rinci memperkenalkan sebuah algoritma bernama TurboQuant, yaitu algoritma kompresi ekstrem.

Tulisan ini merangkum dengan sangat sederhana kegunaan TurboQuant — ia dapat mengompres memori KV cache saat inferensi model besar menjadi 3,5 bit (sekitar 6 kali), dan hampir tidak kehilangan akurasi.

Kalau diterjemahkan ke bahasa sehari-hari, Google Research memperkenalkan sebuah algoritma yang secara besar-besaran mengurangi konsumsi memori model besar; dulu untuk melakukan hal itu diperlukan memori 600G, tetapi setelah memakai algoritma ini, cukup 100G saja!

Keesokan harinya, beberapa perusahaan raksasa penyimpanan yang tadinya masih makan hotpot sambil bernyanyi, langsung harga sahamnya turun.

Saham Micron Technology turun 3,4%, dengan kerugian kapitalisasi sebesar $15.17B; SanDisk sempat anjlok hingga 6,5%, dan saat penutupan penurunannya menyempit menjadi 3,5%, dengan kerugian kapitalisasi sebesar $3,63 miliar. Western Digital turun 1,63%, dengan kerugian kapitalisasi sebesar $1.66B.

Sumber grafik: Sina Finance

Seluruh lingkaran AI meledak; semua orang mulai menganalisis, TurboQuant hebatnya di bagian mana sebenarnya, dan bagaimana ia memengaruhi

Bahkan CEO Claudflare pun memposting dan memberi komentar bahwa ini adalah “momen DeepSeek” ala Google.

Banyak teman klop yang melihat kabar ini mungkin akan ketawa terbahak-bahak di dalam selimut: Kerja bagus! Kalau begitu, apakah memori, SSD (solid-state drive), berikutnya juga bakal ikut turun? Apa partai rakit PC kita akhirnya bisa bangkit?

Tentu saja saya juga berharap semuanya berkembang ke arah itu.

Untuk memastikan apakah keinginan paling sederhana kami ini bisa terwujud, saya juga sengaja melakukan sedikit riset, mempelajari apa sebenarnya TurboQuant itu.

Hasilnya, bahkan sebelum saya benar-benar paham TurboQuant bisa “Turbo” sampai tingkat mana, semuanya berbalik 180 derajat ——

Malam tanggal 27 Maret, seorang doktor post-doc di ETH Zurich, Gao J ianyang, secara bersamaan memposting di Zhihu, X, dan platform penilaian ICLR, menuduh adanya pelanggaran etika akademik yang serius pada artikel ilmiah yang saat itu digunakan Google untuk memperkenalkan algoritma TurboQuant.

Dr. Gao menemukan bahwa TurboQuant milik Google, sangat bertabrakan (overlap tinggi) dengan algoritma RaBitQ yang dibuat timnya sendiri; lapisan dasarnya juga memakai “rotasi acak ditambah transformasi JL”.

Kalau itu hanya berarti “pandangan yang sama oleh para pahlawan,” mungkin masih bisa dimaklumi, tetapi yang keterlaluan adalah: Dr. Gao menunjukkan bukti email bahwa sejak Januari 2025, second author dari paper Google tersebut bernama Majid secara khusus mengirim email, dengan nada merendah, meminta bantuan Dr. Gao untuk menuntaskan cara menjalankan kode RaBitQ.

Ini tidak benar. Apakah tindakan seperti ini—memeriksa sampai ke rincian inti pihak lain, tetapi pada saat perhitungan kemenangan tidak menyebut apa yang dilakukan pihak lain sama sekali?

Tidak hanya menutup-nutupi sumbernya, tim Turbo Quant Google bahkan mengabaikan pembuktian matematika yang sudah ada; langsung di dalam paper, mereka asal-asalan menabrak teori Dr. Gao.

Dr. Gao berpendapat algoritma RaBitQ miliknya sudah terbukti secara ketat mencapai standar kelas satu di level konferensi puncak ilmu komputer teoretis.

Akan tetapi tim TurboQuant sama sekali tidak melihat penurunan (derivasi) tersebut; tanpa bukti apa pun, mereka langsung memberi Dr. Gao cap dalam badan tulisan: “kurang optimal secara teori, analisis kurang mendalam.”

Yang paling bikin tidak tahan, tentu saja, adalah standar ganda penilaian performa versi “ajaib” dari Google.

Paper tersebut membual bahwa algoritma mereka lebih cepat beberapa orde magnitudo daripada RaBitQ, tetapi pengaturan di balik layar sangat tidak bermartabat:

Google menyiapkan monster komputasi A100 GPU untuk dirinya sendiri, sementara untuk lawan mereka menyiapkan CPU dengan thread multi dimatikan.

Dan mereka sengaja tidak menggunakan kode sumber C++ yang sudah tersedia dan sangat dioptimalkan dari pihak lain, malah harus memakai versi Python setengah jadi yang diterjemahkan oleh second author paper TurboQuant untuk menjalankan uji, sehingga memberi “debuff” tambahan pada algoritma Dr. Gao.

Di email bulan Mei tahun lalu, second author paper ini secara pribadi mengakui adanya operasi asimetris “single core menjalankan lebih banyak core” seperti itu, serta mengakui bahwa mereka juga menginformasikan hal tersebut kepada co-author lain di paper.

Namun dalam paper yang akhirnya dipublikasikan, dua lapisan informasi software dan hardware yang bisa memicu perbedaan pada skala perubahan level massa semuanya dihapus bersih.

Selain itu, penulis paper TurboQuant juga menolak mengakui bahwa algoritma mereka secara struktur mirip dengan RabitQ milik Dr. Gao.

Paper dengan kesalahan yang begitu nyata ini diterima oleh konferensi ICLR 2026; setelah itu barulah ada kisah yang kami sebut di awal, ketika melalui jalur resmi Google Research paper tersebut dipromosikan secara masif.

Google Research hanya menyebut betapa hebatnya TurboQuant, bisa menghemat berapa banyak memori, tetapi sama sekali tidak menyebut berbagai kesalahan dalam paper yang menjadi dasar TurboQuant itu sendiri.

Promosi-promosi ini, setelah penayangan di media sosial mencapai puluhan juta kali, akhirnya membuat pasar saham beberapa perusahaan penyimpanan teratas pekan lalu ikut bergetar.

Dr. Gao kemungkinan juga benar-benar tidak tahan lagi, sehingga memilih untuk mempublikasikan bukti secara terbuka melalui postingan.

Tak lama kemudian, pasar penyimpanan perlahan-lahan pulih dari guncangan gelombang pertama.

Pada hari yang sama Amir Zandieh membalas email Dr. Gao, saham Micron Technology (MU) naik 0,5% pada hari itu, dengan nilai transaksi $16.25B, tetapi secara kumulatif sepanjang minggu masih turun 15,5%.

Saya tidak tahu, setelah mendengar cerita ini, teman-teman semuanya merasa apa.

Saya merasa seperti si “tupai” yang lamban di kebun labu: melihat kawan-kawannya sudah menghabiskan camilan dari buah yang dilempar itu, mereka sudah mau pergi makan yang berikutnya, dan saya pun cemas takut tertinggal.

Namun begitu berbalik, saya mendapati kakak-kakak “tupai” sudah sedang menyemburkan omelan —— buah ini, beracun.

Yang lebih sulit dimengerti adalah: paper kontroversial yang jelas-jelas punya kesalahan, baru dilepas untuk promosi oleh Google setahun kemudian; sampai Dr. Gao berdiri untuk menghantam Google, kita sepertinya juga tidak mendengar siapa pun yang berdiri mempertanyakan.

Pasar tidak bicara, hanya berguncang; yang disebut “lingkaran AI” juga hanya pesta pora—akhirnya ada yang bisa mengatasi masalah model-model AI yang terus makan memori secara brutal.

Jumlah lembaga analisis yang masih masuk akal dan media independen domestik yang tidak banyak pun hanya menunjukkan bahwa ini sepenuhnya sesuai dengan “paradoks Jevons” yang sering disebut tua-tua di Wall Street:

TurboQuant memang menurunkan biaya inferensi untuk penalaran teks panjang, tetapi begitu ambang batas diturunkan, perusahaan-perusahaan pasti akan membuka lebar-lebar untuk mengembangkan ——

Sekarang standar arus konteks model buatan dalam negeri adalah 200K-256K, dan sedikit yang bisa mencapai 1M.

Namun model arus utama luar negeri sudah bisa mencapai 1M. Kalau begitu, dengan algoritma ini, apakah model luar negeri akan semakin ingin memperbesar keunggulannya, dan model dalam negeri apakah akan terdorong untuk mengejar?

Nanti, berbagai aplikasi multimodal dan long-context akan diluncurkan dalam jumlah besar; karena lebih mudah digunakan, jumlah pengguna dan skenario akan meningkat berlipat kali, sehingga kebutuhan komputasi dan perangkat keras penyimpanan yang benar-benar diperlukan secara global bukan hanya tidak bisa dihemat, tetapi justru akan langsung “meledak” karena lonjakan permintaan yang sangat besar.

Namun suara yang mempertanyakan apakah TurboQuant benar-benar sesakti itu, sepertinya tertutup. Efeknya seperti: sebagian besar orang, tanpa verifikasi dan tanpa mempelajari kondisi sebenarnya di dunia akademik, langsung menganggap bahwa TurboQuant Google memang bisa mengubah dunia.

Tentu saja, saya bilang begitu bukan untuk mengkritik siapa pun, karena ketika saya pertama kali melihat pemberitaan tentang TurboQuant, saya juga senang seperti anak kecil.

Saya ingin menegaskan bahwa keributan TurboQuant milik Google ini mengekspos ketidaksabaran banyak orang terhadap AI:

Untuk memelihara “penyedot” perangkat keras AI yang rakus, kami sudah menahan terlalu banyak.

Sejak akhir tahun lalu, bahkan produk elektronik seperti ponsel—yang hampir semua orang punya—ikut naik harga karena kenaikan harga memori.

Sumber grafik “Xin Ke Du” Li Qinlin

Saat itulah sifat masalah berubah — AI yang mahal akhirnya tetap harus dibayar oleh semua orang bersama-sama.

Namun ironisnya, sampai sekarang tidak ada yang bisa menjelaskan dengan jelas seberapa besar produktivitas yang dibawa AI, dan seberapa besar kemudahan yang diberikannya.

Awal tahun ini, Anthropic merilis riset penting tentang dampak AI terhadap pasar tenaga kerja.

Riset menunjukkan bahwa sampai saat ini masih hanya ada profesi tertentu yang menggunakan AI, dan tingkat penetrasi AI dalam pekerjaan mereka pun tidak setinggi yang dibayangkan.

Sumber grafik: Anthropic

Begitulah kenyataannya: penetrasi industri ini tidak tinggi, hanya membantu segelintir orang menghasilkan uang, dan sebenarnya produknya tidak sebagus itu—dampak negatif yang ditimbulkannya sedang membuat seluruh masyarakat ikut menanggungnya.

Pada saat seperti ini, kalau saja ada kabar yang memberitahu saya bahwa sekarang ada sesuatu yang bisa membuat nafsu AI mengecil sedikit, jangan lagi ikut menaikkan harga untuk saya—kalau itu benar, saya tentu berharap kabar itu nyata.

Mungkin inilah juga alasannya: sebuah paper yang jelas ada kesalahan, dan sebuah algoritma yang tidak diinvestasikan untuk penggunaan komersial, bisa menimbulkan gelombang besar seperti ini.

Sayangnya, pada akhirnya semua ini terbukti hanya sebuah kekeliruan besar (false alarm).

Penulis: Shi Ang

Editor: Zao Qi & Miro

Berlimpah informasi, interpretasi yang akurat—semuanya ada di aplikasi Sina Finance

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan