Pendiri SemiAnalysis: Pasar Inferensi AI Mungkin Melampaui Minyak, Menjadi Salah Satu Pasar Terbesar Secara Global

Pada 1 Juli, Dylan Patel, pendiri SemiAnalysis, menyatakan dalam wawancara dengan podcast Sequoia Capital "Training Data" bahwa inferensi AI akan menjadi salah satu pasar terbesar secara global, berpotensi melampaui minyak dan menyumbang beberapa persen dari PDB global. Ia percaya bahwa jumlah dan nilai tugas yang diselesaikan setelah setiap iterasi model terus berkembang dengan kecepatan yang lebih cepat daripada pertumbuhan daya komputasi, menunjukkan bahwa kekurangan daya komputasi mungkin bertahan dalam jangka panjang. Patel memperkirakan bahwa pada tahun 2030, permintaan daya komputasi gabungan dari OpenAI dan Anthropic saja akan melampaui 100 gigawatt; dalam 3 hingga 5 tahun ke depan, dampak pusat data luar angkasa akan tetap dapat diabaikan, tetapi pada tahun 2040, lebih dari setengah daya komputasi baru mungkin akan dipasang di luar angkasa. Ia menunjukkan bahwa kendala inti terletak pada biaya energi darat dan kemampuan untuk menghasilkan listrik. Setelah ekonomi penempatan luar angkasa melampaui sistem berbasis darat, migrasi daya komputasi ke luar angkasa akan menjadi tidak terhindarkan. Mengenai desain kolaboratif perangkat keras dan perangkat lunak, Patel mencatat bahwa peningkatan efisiensi AI selama tiga tahun terakhir tidak terutama berasal dari perangkat keras, melainkan dari optimasi kolaboratif tingkat model dan lintas lapisan. Ia mencontohkan DeepSeek, menyatakan bahwa bentuk model ahlinya dioptimalkan secara khusus untuk arsitektur Hopper milik NVIDIA, menghasilkan kinerja yang sangat baik di Hopper tetapi buruk di TPU; model Anthropic lebih cocok untuk TPU, sementara model OpenAI condong ke jalur GPU. Ia percaya bahwa apa yang disebut sebagai parit CUDA bukan hanya tentang CUDA itu sendiri, melainkan ekosistem model sumber terbuka yang secara umum dioptimalkan di sekitar kolaborasi GPU. Patel juga menyebutkan bahwa dukungan kuat CEO NVIDIA Jensen Huang terhadap perusahaan komputasi awan yang sedang berkembang bertujuan untuk mencegah penyedia cloud skala besar memonopoli lanskap daya komputasi dan mendorong pasar multipolar. Selain itu, sistem benchmarking inferensi waktu nyata InferenceX yang dibangun oleh tim SemiAnalysis menunjukkan bahwa pada kualitas yang setara, biaya inferensi telah menurun sekitar 60 kali lipat setiap tahun, dan kecerdasan per watt telah meningkat sekitar 40 kali lipat.
DEEPSEEK-0,85%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan