Kebuntuan biaya AI: Bagaimana ekonomi infrastruktur akan membentuk ulang tahap berikutnya dari pasar

来源:International Business Times UK

原文作者:Anastasia Matveeva |

编译整理:Gonka.ai

AI sedang berkembang dengan kecepatan yang mengagumkan, tetapi logika ekonomi dasarnya jauh lebih rapuh daripada yang terlihat di permukaan. Ketika tiga raksasa cloud menguasai dua pertiga kekuatan komputasi global, biaya pelatihan mendekati 1 miliar dolar, dan tagihan inferensi membuat startup terkejut—biaya sebenarnya dari perlombaan persenjataan kekuatan komputasi ini secara diam-diam sedang mengubah distribusi nilai seluruh industri AI.

Artikel ini bukan membahas siapa yang akan membangun model paling canggih. Ini membahas pertanyaan yang lebih mendasar: apakah model ekonomi infrastruktur AI saat ini, setelah skala besar, benar-benar berkelanjutan? Bagaimana perubahan mekanisme distribusi kekuatan komputasi akan mengubah distribusi nilai pasar secara keseluruhan?

  1. Biaya Kecerdasan di Balik Layar

Melatih model besar terdepan, seringkali membutuhkan puluhan juta hingga ratusan juta dolar. Anthropic pernah menyatakan secara terbuka bahwa biaya pelatihan Claude 3.5 Sonnet adalah “puluhan juta dolar,” dan CEO-nya, Dario Amodei, sebelumnya memperkirakan bahwa biaya pelatihan model generasi berikutnya bisa mendekati 1 miliar dolar. Menurut media industri, biaya pelatihan GPT-4 mungkin sudah melebihi 100 juta dolar.

Namun, biaya pelatihan hanyalah puncak gunung es. Yang benar-benar memberi tekanan secara struktural adalah biaya inferensi—yaitu biaya yang timbul setiap kali model dipanggil. Berdasarkan harga API yang dipublikasikan OpenAI, inferensi dihitung per juta token. Untuk aplikasi dengan penggunaan tinggi, ini berarti bahwa bahkan sebelum skala besar, biaya inferensi harian bisa mencapai ribuan dolar.

AI sering digambarkan sebagai perangkat lunak. Tetapi esensi ekonominya semakin mirip infrastruktur berbasis modal—yang memiliki investasi awal besar dan biaya operasional yang terus menerus.

Perubahan struktur ekonomi ini secara diam-diam mengubah pola kompetisi di industri AI. Mereka yang mampu menanggung biaya kekuatan komputasi adalah perusahaan besar yang sudah membangun infrastruktur skala besar; sementara startup yang berusaha bertahan di celah-celah pasar semakin terkikis oleh tagihan inferensi sedikit demi sedikit.

  1. Intensitas Modal dan Konsentrasi Pasar

Menurut analisis pasar cloud Holori 2026, saat ini AWS menguasai sekitar 33% pangsa pasar cloud global, Microsoft Azure sekitar 22%, dan Google Cloud sekitar 11%. Ketiga perusahaan ini mengendalikan sekitar dua pertiga infrastruktur cloud global, dan sebagian besar beban kerja AI di dunia berjalan di atas infrastruktur mereka.

Makna nyata dari konsentrasi ini adalah: ketika API OpenAI mengalami gangguan, ribuan produk sekaligus terpengaruh; ketika salah satu penyedia cloud utama mengalami gangguan, layanan lintas industri dan wilayah pun terhenti.

Konsentrasi ini tidak menyusut, malah terus berkembang. Sebagai contoh, Nvidia melaporkan pendapatan tahunan dari bisnis pusat data mereka telah menembus 80 miliar dolar, menunjukkan permintaan GPU berkinerja tinggi yang terus tinggi.

Lebih menarik lagi adalah ketidaksetaraan struktural yang tersembunyi. Berdasarkan dokumen SEC dan laporan pasar, laboratorium terkemuka seperti OpenAI dan Anthropic mengunci sumber daya GPU dengan kesepakatan “pertukaran saham dengan kekuatan komputasi” bernilai miliaran dolar—dengan harga terendah sekitar 1,30–1,90 dolar per jam. Sementara perusahaan kecil dan menengah yang tidak memiliki kemitraan strategis dengan Nvidia, Microsoft, atau Amazon harus membeli dengan harga ritel lebih dari 14 dolar per jam—dengan premi hingga 600%.

Perbedaan harga ini didorong oleh investasi strategis Nvidia sebesar 40 miliar dolar ke laboratorium terkemuka. Hak akses infrastruktur AI semakin didominasi oleh kesepakatan pembelian modal intensif, bukan kompetisi pasar terbuka.

Pada tahap adopsi awal, konsentrasi ini tampak “efisien.” Tetapi setelah skala besar, hal ini membawa risiko harga, hambatan pasokan, dan ketergantungan infrastruktur—tiga kerentanan yang saling bertumpuk.

  1. Dimensi Energi yang Terabaikan

Masalah biaya infrastruktur AI juga memiliki dimensi yang sering diabaikan: energi.

Menurut data dari International Energy Agency (IEA), pusat data saat ini menyumbang sekitar 1–1,5% konsumsi listrik global, dan pertumbuhan permintaan yang didorong AI berpotensi secara signifikan meningkatkan angka ini dalam beberapa tahun ke depan.

Ini berarti, ekonomi kekuatan komputasi bukan hanya masalah keuangan, tetapi juga tantangan infrastruktur dan energi. Seiring beban kerja AI terus berkembang, signifikansi geopolitik dari pasokan listrik akan semakin menonjol—negara mana yang mampu menyediakan kekuatan komputasi paling stabil dengan biaya energi terendah akan memiliki keunggulan struktural dalam kompetisi industri era AI.

Ketika Jensen Huang mengumumkan di GTC26 bahwa visibilitas pesanan Nvidia melampaui 1 triliun dolar, yang dia gambarkan bukan hanya keberhasilan bisnis perusahaan, tetapi juga proses besar di mana seluruh peradaban mengubah listrik, tanah, dan mineral langka menjadi kekuatan komputasi cerdas.

  1. Memikirkan Ulang Mekanisme Infrastruktur

Sementara pusat data terpusat terus berkembang, muncul pula eksplorasi lain—yang berusaha mendefinisikan ulang pengaturan sumber daya kekuatan komputasi secara fundamental.

Inferensi Terdesentralisasi: Alternatif Struktural

Gonka protocol adalah contoh praktik yang mewakili arah ini. Ini adalah jaringan desentralisasi yang dirancang khusus untuk inferensi AI, dengan tujuan utama: meminimalkan overhead sinkronisasi dan konsensus, serta mengarahkan sebanyak mungkin sumber daya komputasi ke beban kerja AI nyata.

Dalam aspek tata kelola, Gonka menerapkan prinsip “satu unit kekuatan komputasi satu suara”—hak suara ditentukan oleh kontribusi kekuatan komputasi yang dapat diverifikasi, bukan berdasarkan kepemilikan modal. Secara teknis, protokol menggunakan interval pengukuran kinerja siklus pendek (disebut Sprint), yang mengharuskan peserta menunjukkan kekuatan GPU nyata secara real-time melalui mekanisme bukti kerja berbasis Transformer (PoW).

Makna dari desain ini adalah: hampir 100% kekuatan jaringan diarahkan ke beban kerja inferensi AI itu sendiri, bukan digunakan untuk menjaga konsensus, komunikasi, dan overhead infrastruktur lainnya.

Ekonomi Kekuatan Komputasi Terdistribusi

Dari sudut pandang ekonomi, nilai dari jaringan kekuatan komputasi terdesentralisasi memiliki tiga lapisan.

Pertama adalah lapisan biaya. Struktur harga penyedia cloud terpusat secara esensial mencakup depresiasi aset tetap yang besar, biaya operasional pusat data, dan keuntungan pemegang saham. Jaringan desentralisasi dapat mengurangi biaya ini secara signifikan dengan mengubah GPU yang tidak terpakai menjadi aset yang dapat diperdagangkan. Sebagai contoh, melalui GonkaGate, layanan inferensi yang ditawarkan saat ini dihargai sekitar 0,0009 dolar per juta token—sementara layanan serupa dari penyedia terpusat seperti Together AI untuk model yang sama (misalnya DeepSeek-R1) dihargai sekitar 1,50 dolar, selisih hingga ribuan kali lipat.

Kedua adalah lapisan elastisitas pasokan. Penyedia cloud terpusat memiliki pasokan kekuatan komputasi yang kaku, dengan siklus ekspansi yang dihitung dalam bulan atau kuartal. Jaringan desentralisasi memungkinkan peserta untuk bergabung atau keluar secara fleksibel sesuai kebutuhan, secara teori mampu merespons lonjakan permintaan dengan lebih cepat—seperti halnya Amazon Web Services yang lahir dari kebutuhan lonjakan lalu lintas saat liburan, fluktuasi puncak dan lembah dalam inferensi AI juga membutuhkan infrastruktur yang elastis.

Ketiga adalah lapisan kedaulatan. Dimensi ini sangat penting dari perspektif negara berdaulat. Ketika layanan publik suatu negara sangat bergantung pada satu penyedia cloud asing, ketergantungan kekuatan komputasi menjadi kerentanan strategis. Jaringan desentralisasi menawarkan solusi: pusat data lokal dapat bergabung sebagai node dalam jaringan global yang tersebar, menjaga kedaulatan data sekaligus menyediakan kekuatan komputasi secara berkelanjutan untuk pasar global.

  1. Momen Rekonstruksi Distribusi Nilai

Kembali ke pertanyaan inti di awal: apakah model ekonomi infrastruktur AI saat ini, setelah skala besar, benar-benar berkelanjutan?

Jawabannya: untuk pemain utama, ya; untuk semua yang lain, semakin tidak berkelanjutan.

AWS, Azure, Google Cloud telah membangun benteng melalui akumulasi modal selama puluhan tahun, dan keunggulan skala mereka dalam jangka pendek hampir tidak tergoyahkan. Tetapi, struktur keunggulan ini juga berarti: kekuasaan dalam penetapan harga, akses data, dan ketergantungan infrastruktur sangat terkonsentrasi di tangan beberapa entitas swasta.

Sejarah menunjukkan bahwa setiap monopoli besar dalam infrastruktur teknologi akhirnya melahirkan arsitektur terdistribusi alternatif—Internet sendiri adalah perlawanan terhadap monopoli telekomunikasi, BitTorrent merevolusi distribusi konten terpusat, dan Bitcoin menantang sentralisasi penerbitan uang.

Desentralisasi infrastruktur AI mungkin bukan sekadar pilihan ideologis, melainkan sebuah keharusan ekonomi—ketika biaya sentralisasi menjadi cukup tinggi untuk mendorong migrasi besar-besaran pengguna, kebutuhan akan solusi alternatif akan benar-benar muncul. Jensen Huang membandingkan ini dengan “setiap krisis keuangan mendorong lebih banyak orang ke Bitcoin,” dan analogi ini juga berlaku untuk pasar kekuatan komputasi.

Kemunculan DeepSeek membuktikan satu hal: dalam dunia di mana model sumber terbuka mendekati kemampuan model tertutup, biaya inferensi akan menjadi variabel utama dalam menentukan kecepatan skala aplikasi AI. Siapa yang mampu menyediakan kekuatan inferensi dengan biaya terendah dan ketersediaan tertinggi, dia akan memegang tiket masuk dalam kompetisi ini.

Penutup: Perang Infrastruktur Baru Dimulai

Persaingan tahap berikutnya dalam AI tidak akan ditentukan oleh peringkat kemampuan model, melainkan oleh permainan ekonomi infrastruktur.

Raksasa kekuatan terpusat memegang keunggulan modal dan skala, tetapi juga menanggung biaya tetap dan tekanan harga. Jaringan desentralisasi menawarkan pasar dengan biaya marginal sangat rendah, tetapi harus membuktikan kestabilan, kemudahan penggunaan, dan skala ekosistem yang mampu memenuhi ambang bisnis nyata.

Kedua jalur ini akan berlangsung dalam jangka panjang dan saling menekan. Ketegangan antara pusat dan desentralisasi akan menjadi salah satu tema struktural paling menarik untuk dipantau dalam lima tahun ke depan.

Perang infrastruktur ini baru saja dimulai.

BTC-3,52%
BTT-1,62%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan