Pesta pembiayaan model dunia sedang berlangsung, modal berinvestasi di jalur AI fisika bernilai triliun rupiah

Berita Harian Securities Reporter Chen Yukang

Gelombang “Lobster” (OpenClaw) yang muncul tahun ini menunjukkan sisi AI (kecerdasan buatan) yang serba bisa, mampu menangkap data, menulis kode, menghasilkan film besar, dan mengendalikan komputer. Namun begitu keluar dari layar, robot menghadapi dunia nyata seperti anak kecil yang masih belajar, hanya mampu melakukan gerakan tetap dan berurutan, “Paradoks Moravec” menghalangi jalan manusia menuju kecerdasan buatan umum (AGI).

Model dunia adalah kunci untuk memecahkan kebuntuan ini, karena memungkinkan robot memahami hukum fisika dunia nyata secara nyata, memiliki kemampuan berpikir dan bernalar, dan merupakan jalur utama untuk mencapai AGI. Tahun ini, pemenang Penghargaan Turing Yang Likun mendirikan perusahaan model dunia, perusahaan model dunia dari “ibu pengasuh AI” Li Feifei mendapatkan pendanaan besar, dan lebih dari 20 kasus pendanaan terkait model dunia muncul di dalam negeri, industri menyebut model dunia sebagai peluang penting AI selama 10 tahun ke depan.

Beberapa pengusaha di bidang AI mengatakan kepada wartawan Securities Times bahwa model dunia dapat memungkinkan AI benar-benar memahami dan berinteraksi dengan dunia fisik, dan ini adalah jalur wajib untuk mencapai AGI. Saat ini, pengembangan model dunia masih dalam tahap awal, siapa yang bisa lebih dulu menggerakkan roda data interaksi fisik akan memperoleh keunggulan dalam pengembangan.

AI harus berakar dan berkembang di dunia nyata

OpenAI baru-baru ini mengumumkan penutupan aplikasi pembuatan video Sora dan menyesuaikan arah strateginya: setelah ini, tim Sora akan fokus pada penelitian model dunia.

Mengabaikan pembuatan realitas oleh AI, dan beralih agar AI memahami realitas, keputusan OpenAI mencerminkan posisi strategis berikutnya di industri: model dunia. Menurut penjelasan dari Fudan University dan universitas lain, model dunia belajar dan memprediksi karakteristik dinamis seperti gerak, gaya, dan hubungan ruang dari data sensor, untuk memahami sifat, hukum gerak, dan karakteristik ruang dari benda-benda di dunia fisik. Dengan bantuan model dunia, AI beralih dari pengenalan dan pengenalan ke pemahaman dan penalaran, yang merupakan dasar untuk kecerdasan embodied dan interaksi otonom yang efisien dengan lingkungan objektif.

Asisten Dekan Fakultas Manajemen Fudan University, Kepala Departemen Manajemen Informasi dan Kecerdasan Bisnis Zhang Cheng mengatakan kepada wartawan Securities Times bahwa esensi dari “berpikir” AI adalah prediksi probabilistik berbasis data statistik, yang kurang memiliki emosi sejati dan pemahaman mendalam tentang dunia. Masalah utamanya adalah model sebagian besar dibangun di atas data bahasa, dan ketika model hanya belajar dari teks, batasan kognisinya terbatas pada apa yang bisa diekspresikan bahasa; sedangkan model dunia memungkinkan sistem menggunakan multimodalitas, termasuk visual, audio, dan dinamika ruang, untuk memodelkan hukum operasi lingkungan.

Miao Zhen, Partner Kepala Audit di Divisi Otomotif China dari KPMG China, mengatakan kepada wartawan Securities Times bahwa nilai inti dari model dunia terletak pada membangun dunia paralel virtual yang sesuai dengan hukum fisika, dan melalui pemahaman ruang lingkungan serta prediksi berjangka panjang, output keputusan, simulasi skenario, prediksi sebab-akibat, dan cakupan skenario ekor panjang, sehingga mengatasi kekurangan model berbasis data murni dalam generalisasi terhadap skenario ekstrem.

Tanpa model dunia, batas maksimal robot kemungkinan hanyalah alat otomatisasi tingkat tinggi yang menjalankan kode secara pasif. Pendiri dan CEO Coowa Technology He Tao memberi contoh tantangan nyata dalam penerapan robot kebersihan di kota: robot dapat menghindari tembok standar, tetapi ketika mendekati cabang pohon yang patah atau tumpukan tidak beraturan, karena kode preset tidak mendefinisikan objek tersebut, sistem menganggapnya sebagai hambatan tak dapat dilalui, sehingga berhenti di tempat. “Jika ada model dunia, sistem dapat memprediksi berdasarkan bahan dan sifat fisik, merencanakan jalur mengelak, bahkan mendorong objek secara ringan dalam kondisi aman, sehingga menjaga kelangsungan operasi.”

Kebangkitan pendanaan model dunia

Berdasarkan prospek dan potensi model dunia, modal domestik dan internasional telah banyak berinvestasi. Pada Februari lalu, perusahaan model dunia yang didirikan Li Feifei menyelesaikan pendanaan sebesar 1 miliar dolar AS; tak lama kemudian, perusahaan startup model dunia Yang Likun, AMI, juga menyelesaikan pendanaan lebih dari 1 miliar dolar AS.

Di dalam negeri, data dari Qichacha menunjukkan bahwa sejak awal tahun ini, terjadi 25 kasus pendanaan terkait model dunia, dengan total pendanaan lebih dari 2,2 miliar yuan. Di antaranya, Jiji Vision mengumumkan penyelesaian pendanaan pra-seri B sebesar 1 miliar yuan pada Maret, dan bulan yang sama mengumumkan model dunia embodied GigaWorld-1 menempati posisi teratas dalam daftar WorldArena.

“Fenomena ‘gelembung pendanaan’ model dunia menunjukkan bahwa konsensus industri sedang terbentuk: AI dari dunia digital menuju dunia fisik adalah medan perang utama berikutnya,” kata pejabat dari Qinglang Intelligence dalam wawancara dengan wartawan Securities Times. Ia menambahkan bahwa selama 10 tahun terakhir, lonjakan kemampuan AI terutama terjadi di bidang persepsi dan bahasa. Tetapi untuk benar-benar masuk ke dunia fisik, harus memahami hukum operasionalnya: hubungan ruang, sebab-akibat, dan atribut fisik.

Pejabat tersebut menyatakan bahwa investasi modal pada model dunia pada dasarnya adalah taruhan pada jalur miliaran yuan AI fisik. Rute teknologi masa depan diharapkan beralih dari integrasi besar ke spesialisasi, dengan model dunia bertanggung jawab atas intuisi fisik, model visual—bahasa—tindakan (VLA) bertanggung jawab atas pemahaman semantik, dan kontrol dasar bertanggung jawab atas eksekusi presisi. Pembagian tugas yang jelas memungkinkan investor menemukan titik masuk yang lebih tepat.

He Tao mengatakan kepada wartawan Securities Times bahwa pendanaan besar-besaran sejak 2026 untuk model dunia menunjukkan bahwa modal dan komunitas teknologi sepakat bahwa “langkah berikutnya dari model bahasa besar adalah dunia fisik,” dan bahwa model dunia adalah jalur utama menuju AI fisik. Model dunia adalah kunci menuju AI fisik, dan momen “ChatGPT embodied” akan segera tiba. Dalam kompetisi industri model dunia di masa depan, perusahaan yang menguasai akses data fisik skala besar dan mampu menutup siklus bisnis akan memimpin revolusi teknologi ini.

Membuat robot lebih mirip “manusia”

Beberapa tahun terakhir, AGI digital berbasis model bahasa besar telah merombak dunia digital. Sekitar setengah dari PDB global berada di dunia fisik, dan potensi pertumbuhan AGI fisik masih tak terbatas. Dasar dari kemajuan AGI fisik adalah model dunia. Berbekal akumulasi teknologi dan data dari model end-to-end dan model vertikal sebelumnya, banyak perusahaan AI tahun ini mulai memusatkan bisnis mereka pada model dunia.

Coowa Technology merilis Coowa WAM 2.0, model dunia umum, pada Februari. He Tao mengatakan bahwa peluncuran model ini bertujuan mengatasi masalah umum di industri kecerdasan embodied, yaitu “kurangnya kemampuan generalisasi” dan “batas pengembangan industri.” Sebelumnya, industri banyak bergantung pada model end-to-end berbasis aturan atau skenario tunggal, tetapi WAM 2.0 memberi entitas AI fisik berbagai bentuk kemampuan pemahaman pengetahuan umum, deduksi geometris, dan prediksi sebab-akibat terhadap dunia fisik yang kompleks.

Seperti halnya model bahasa besar yang bergantung pada data teks dari internet, iterasi model dunia juga bergantung pada data interaksi bernilai tinggi yang dihasilkan oleh perangkat fisik di dunia nyata. He Tao menyatakan bahwa perusahaan berencana mengirim robot pengelola kota berbasis WAM 2.0 langsung ke jalanan kota untuk operasi rutin, sambil menciptakan keuntungan komersial dan secara bersamaan mengumpulkan data fisik berkualitas tinggi yang akan memperbaiki model.

Qinglang Intelligence, perusahaan terkemuka di bidang robot layanan, merupakan perusahaan terdepan dalam pengiriman robot layanan komersial di seluruh dunia. Tahun lalu, mereka meluncurkan model VLA pertama di dunia untuk industri layanan, yaitu KOM2.0.

Pejabat dari Qinglang Intelligence mengungkapkan bahwa mereka sedang aktif mengeksplorasi integrasi model VLA dan model dunia. Kekurangan model VLA adalah kurangnya pemahaman sebab-akibat terhadap dunia fisik, sehingga sulit memprediksi konsekuensi fisik dari tindakan. Model dunia adalah kunci menuju “pembelajaran dengan sedikit sampel” dan “generalitas tanpa sampel,” karena memungkinkan robot memodelkan konsekuensi tindakan dalam “pikiran” mereka dan memilih strategi terbaik.

“Model dunia adalah dasar untuk interaksi manusia-robot yang aman. Dalam skenario layanan, robot perlu memprediksi konsekuensi tindakan, seperti kekuatan saat mengantarkan barang. Tanpa model dunia, robot tidak dapat benar-benar memahami rantai sebab-akibat ini,” kata pejabat tersebut. Ia menambahkan, “Tahun ini, perusahaan akan mulai menguji kemampuan prediksi model dunia di beberapa skenario untuk meningkatkan adaptasi dan keamanan robot.”

Perusahaan robot “blue-collar” Shanghai Kepler Robotics juga mulai membangun model dunia industri dan model dunia rumah tangga. CTO mereka, Xi Ao, mengatakan bahwa mereka berencana mengintegrasikan model dunia industri dengan VLA industri dan melakukan uji coba kecil (POC) untuk membuktikan efektivitasnya, sebagai dasar untuk penerapan skala besar di masa depan.

Batas data mungkin menentukan daya saing model dunia

Tahun lalu disebut sebagai tahun pertama kecerdasan embodied, di mana robot menunjukkan “kemampuan terbatas,” tetapi juga mengungkapkan kelemahan mereka yang kurang cerdas. Dengan semakin banyak perusahaan yang mengembangkan model dunia, banyak ahli industri menyatakan bahwa 2026 akan menjadi tahun dasar bagi model dunia untuk mendukung AGI. Jim Fan, kepala robot Nvidia, pernah menyatakan bahwa 2026 akan menjadi tahun pertama model dunia besar benar-benar membangun fondasi untuk robot dan AI multimodal yang lebih luas.

Meskipun prospek cerah dan kecepatan evolusi yang tinggi, jalur model dunia masih dalam tahap awal, dan belum ada paradigma teknologi yang seragam dan matang. Yang lebih mengkhawatirkan adalah kekurangan data fisik berkualitas tinggi, yang sangat membatasi penyebaran model dunia.

He Tao menyatakan bahwa evolusi model dunia akan sangat terkait dengan tiga tahap industri kecerdasan embodied: dari transformasi vertikal saat ini, ke kolaborasi skenario dalam dua tahun ke depan, dan kemudian ke adopsi skenario rumah tangga dalam tiga sampai lima tahun. Saat ini, industri berada di masa kritis transisi dari tahap pertama ke tahap kedua. Tantangan utama saat ini adalah kekurangan data interaksi fisik nyata yang berkualitas tinggi dan multimodal.

“Data operasional tidak bisa sepenuhnya bergantung pada data video internet atau simulasi komputer. Dengan kata lain, model dunia yang benar tidak bisa dibangun di dalam rumah kaca, dan data simulasi cloud saja tidak mampu menyelesaikan masalah panjang ekor tak berujung dari dunia fisik,” kata He Tao.

Pejabat dari Qinglang Intelligence menambahkan bahwa dalam jangka pendek, kombinasi VLA dan reinforcement learning sudah mampu menyelesaikan banyak masalah praktis. Tetapi dari sudut pandang pengembangan kecerdasan embodied, seiring robot memasuki lingkungan yang lebih terbuka dan kompleks (seperti rumah dan tempat umum), sistem tanpa model dunia akan menghadapi batasan generalisasi. Pada saat itu, perusahaan yang memiliki kemampuan model dunia akan mendapatkan keunggulan generasi. Dalam jangka panjang, model dunia akan menjadi kemampuan wajib bagi robot umum.

“Batas data sedang terbentuk, keunggulan awal sangat penting. Pengumpulan dan penggunaan data fisik berkualitas tinggi adalah tantangan utama,” tegas pejabat tersebut. Ia menambahkan bahwa modal berinvestasi pada perusahaan yang mampu mengoperasikan siklus “data—model—skenario” secara lancar. Jika perusahaan mampu melakukan penerapan skala besar di dunia nyata terlebih dahulu, mereka akan memperoleh keunggulan awal.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan