Forum Tahun Baru 2026 Zhongguancun | Pemimpin Kecerdasan Berwujud Membahas Kebuntuan Data dan Solusi Skenario

robot
Pembuatan abstrak sedang berlangsung

(Sumber: Beijing Business Daily)

Pada 27 Maret 2026, Konferensi Tahunan Forum Zhongguancun bertema “Forum AI Open-Source Frontier” mengadakan sebuah diskusi meja bundar yang berfokus pada kecerdasan yang berwujud (embodied intelligence). Berdasarkan “Laporan Pembangunan Tiongkok 2025” yang dirilis oleh Pusat Penelitian Pembangunan Dewan Negara, perkembangan industri kecerdasan yang berwujud Tiongkok masih berada pada tahap awal; ukuran pasar diperkirakan dapat mencapai 400 miliar yuan pada 2030 dan menembus 1 triliun yuan pada 2035. Di titik start dari jalur persaingan 1 triliun yuan tersebut, para tokoh kunci dari perusahaan seperti Galaxy General, Qianxun Intelligent, dan Xingdong Yuan mengadakan dialog mendalam, membahas pembangunan “piramida data”, arsitektur “otak-kecil otak-besar”, serta jalur penerapan di skenario dunia nyata, untuk menelusuri tantangan kunci dan pemikiran terobosan agar kecerdasan yang berwujud pada 2026 dapat beranjak dari eksperimen laboratorium menuju penerapan skala besar.

Wang He, pendiri Galaxy General: Piramida data akan digunakan secara luas pada 2026

Jalur kecerdasan yang berwujud pada 2025 telah benar-benar dinyalakan; modal mengalir masuk, dan model bermunculan tanpa henti. Beberapa konsep menjadi semakin jelas, termasuk definisi otak besar dan otak kecil untuk robot humanoid.

Otak bertanggung jawab atas keluaran dari persepsi, kognisi, hingga perencanaan aksi, sedangkan otak kecil, melalui keluaran tersebut, menjalankan aksi pada tubuh (badan/wujud) dengan cara yang robust—memberikan fleksibilitas tinggi sekaligus stabilitas. Setelah otak besar dan otak kecil digabungkan menjadi satu, tugas-tugas seperti operasi, navigasi, dan gerak seluruh tubuh berhasil dibuka.

Kecerdasan yang berwujud membentuk piramida yang jelas pada tingkat data: lapisan dasar adalah data internet; lapisan berikutnya adalah data perilaku manusia; lalu di atasnya adalah data sintetis; dan lapisan teratas adalah data dunia nyata. Piramida data ini dibangun pada 2025 dan akan digunakan secara luas pada 2026. Pada saat itu, keseluruhan teknologi penggabungan VLA (model aksi bahasa-visual) dan world action model akan mengalami lompatan nyata.

Xi Yue, co-founder Xingdong Yuan: Membangun “data flywheel” adalah kunci untuk menembus hambatan

Saat ini, kesulitan terbesar dalam kecerdasan yang berwujud masih terletak pada data. Agar robot benar-benar dapat bekerja secara mandiri di pabrik atau lingkungan khusus, data harus dikumpulkan di lingkungan nyata. Namun, skenario sulit dibuka, biaya pengambilan data skala besar tinggi, dan prosesnya sangat memakan waktu.

Saat ini, solusi yang paling umum adalah mereplikasi skenario nyata: membangun lingkungan 1:1 di dalam area pelatihan. Akan tetapi, ini tidak cukup untuk menyelesaikan semua masalah. Mengandalkan insinyur untuk mengumpulkan data, melakukan pelatihan, penerapan, lalu mengulang siklus—model ini sangat tidak efisien dan biayanya mahal.

Solusi kami adalah membangun “data flywheel”, yaitu siklus tertutup dari pengumpulan data hingga model, agar robot dapat memproses corner case (kasus tepi) secara mandiri di lingkungan nyata dan terus meningkatkan efisiensinya tanpa henti. Kami juga sedang mengeksplorasi pola pengumpulan data yang memadukan manusia dan mesin sungguhan.

Gao Yang, co-founder Qianxun: 2025 adalah era GPT-2.0 untuk kecerdasan yang berwujud, dan 2026 akan memasuki GPT-3.0

Dalam pemahaman saya, kecerdasan yang berwujud juga memiliki tahapan seperti GPT-2.0 dan GPT-3.0. Pada 2025, kita berada di era 2.0—yang telah menyelesaikan banyak masalah infrastruktur pada lapisan data, serta menyiapkan fondasi awal untuk penerapan skala besar. Pusat kerja pada 2026 akan beralih pada menangani model yang semakin besar, data yang semakin banyak, serta memastikan hasil yang efektif untuk penerapan skala besar.

Sebenarnya, dalam proses perkembangan, sangat sulit untuk benar-benar melihat kita sedang berada pada tahap yang mana saat ini; kondisinya ibarat melihat kabut. Saya mendefinisikan fase awal 2025 berada pada 2.0 atau 3.0, karena beberapa model yang ada saat ini sudah memiliki kemampuan generalisasi dasar—seperti halnya GPT-2.0 yang memiliki kemampuan percakapan dasar. Namun, dalam banyak kesempatan, jawabannya masih tidak tepat. Melalui riset bersama di dunia akademik dan industri, pada akhir 2026 atau pertengahan 2027 sangat mungkin muncul model seperti GPT-3.0.

Zhang Peng, co-founder Zhi Pingfang: Validasi skenario adalah kata kunci pada 2025

Hal yang paling penting pada 2025 adalah mewujudkan validasi skenario secara nyata, agar robot dapat beralih dari laboratorium ke skenario dunia nyata. Pada 2026, lebih banyak yang perlu diselesaikan adalah bagaimana membuat model robot semakin baik.

Dari sisi teknis, diperlukan terobosan pada generalisasi skenario dunia nyata. Dengan rancangan arsitektur model dan desain sistem, robot dapat menyesuaikan diri dengan lebih banyak skenario dengan biaya yang lebih kecil—ini merupakan tantangan besar bagi industri. Kami berharap dapat mengumpulkan lebih banyak data di skenario dunia nyata; berdasarkan data tersebut, melalui metode seperti sintetis, menghasilkan lebih banyak nilai sekaligus menurunkan biaya. Di skenario dunia nyata, yang seharusnya terjadi adalah penggabungan terpadu antara model, perangkat keras, dan sistem skenario untuk bersama-sama menyelesaikan masalah.

Reporter Beijing Business Daily: Wei Wei

Berita dalam jumlah besar, interpretasi yang akurat—selalu ada di aplikasi Sina Finance

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan