Percakapan dengan Yuan Li Ling Ji Tang Wenbin: Rute Murni "Model Dunia" Tidak Dapat Dilalui

Sebuah “perang data” tersembunyi tentang kecerdasan embodied sedang berlangsung secara diam-diam.

Pada Januari tahun ini, Pusat Inovasi Robot Manusia Hubei menyerahkan ribuan jam data pelatihan kepada Zhiyuan Robot, menyelesaikan transaksi data robot manusia kustom pertama di dalam negeri.

Di kalangan raksasa industri, JD.com baru-baru ini mengumumkan slogan untuk membangun pusat pengumpulan data kecerdasan embodied terbesar di dunia dengan cakupan skenario terlengkap, berencana mengerahkan lebih dari 100.000 karyawan internal dan hingga 500.000 orang eksternal, memulai sebuah “perang manusia” yang belum pernah terjadi sebelumnya.

Berpaling ke luar negeri, perusahaan robot Korea Robotis pada Januari tahun ini mendirikan anak perusahaan di Uzbekistan, berencana membangun sebuah “pabrik data” besar di atas tanah seluas 110.000 meter persegi, untuk mengumpulkan data perilaku robot.

Transaksi kustom berbasis jam, mobilisasi puluhan ribu orang, dan pembangunan pabrik di Asia Tengah—serangkaian langkah ini mencerminkan “kecemasan data” yang berat di seluruh industri kecerdasan embodied.

Berbeda dengan model bahasa besar yang berkembang dari korpus internet, kecerdasan embodied membutuhkan pemahaman tentang dunia dan interaksi dengan dunia nyata, yang menuntut keaslian data, modalitas, dan aspek lain dengan standar yang lebih tinggi.

Ini juga menjadi salah satu tantangan utama yang sedang dihadapi oleh pendiri dan CEO Yuanli Lingji, Tang Wenbin.

Melihat kembali riwayatnya, identitas yang lebih dikenal dari Tang Wenbin adalah sebagai salah satu pendiri dan CTO dari Megvii, unicorn terkenal di gelombang AI sebelumnya.

Yuanli Lingji yang baru berusia satu tahun telah diam-diam mengumpulkan lebih dari 1 miliar yuan, mendapatkan investasi dari institusi terkemuka seperti Alibaba, NIO, Junlian, Qiming, dan lainnya.

Saat ini, Yuanli Lingji telah merilis model besar native embodied pertama mereka, DM0, dan menjalin kerjasama strategis dengan Huachin Technology untuk memproduksi massal robot pengumpul data DOS-W1.

Setelah mengalami gelombang penerapan AI sebelumnya, Tang Wenbin kini memiliki rasa hormat yang lebih besar terhadap industri ini.

Dalam wawancara baru-baru ini dengan Wall Street Journal dan All-Weather Tech, Tang Wenbin membagikan pemikirannya tentang pengumpulan data Yuanli Lingji: tidak bergantung pada satu sumber tunggal, melainkan melakukan pengumpulan terdistribusi dengan kombinasi “kualitas ✖ kuantitas ✖ keberagaman” untuk mengisi ruang kemampuan robot.

Mengenai metode menghasilkan data melalui model dunia agar robot dapat belajar meniru, Tang Wenbin berpendapat bahwa jalan ini sulit ditempuh. Ia menegaskan bahwa paradigma yang lebih feasible adalah menggabungkan model dunia dengan model VLA (visual-language-action), yaitu tidak hanya mampu memprediksi masa depan dunia, tetapi juga mampu menarik kembali aksi yang diperlukan secara tepat berdasarkan prediksi tersebut.

Ketika para pemain industri secara gila-gilaan “menimbun” data dengan berbagai cara, pasar sedang menunggu untuk melihat jalur mana yang akan “tersenyum terakhir”.

Berikut adalah rekaman wawancara lengkapnya.

Penjelasan Mendalam tentang Pengumpulan Data

All-Weather Tech: Bisakah Anda berbagi pemikiran tentang strategi pengumpulan data Anda?

Tang Wenbin: Saat ini, kami masih meniru metode reinforcement learning.

Tiru melibatkan simulasi distribusi data. Tujuan kami adalah agar data sebisa mungkin mengisi ruang kemampuan robot, agar robot melihat cukup banyak hal. Intinya adalah kemampuan mengenali dan menangani skenario yang belum pernah dilihat sebelumnya; nilai data terletak di situ. Oleh karena itu, pengumpulan data kami berfokus pada lingkungan terbuka dan skenario nyata.

Namun, kami ingin data tetap berkualitas tinggi sekaligus mengisi ruang tersebut sebanyak mungkin, jadi saya melihat data sebagai kombinasi dari “kualitas ✖ kuantitas ✖ keberagaman”.

All-Weather Tech: Lalu, bagaimana cara Anda mengumpulkan data?

Tang Wenbin: Sebenarnya, kami tidak bergantung pada satu sumber data tertentu, karena itu tidak perlu. Pendekatan kami adalah kombinasi. Untuk data dari perangkat nyata, utama melalui berbagai sensor yang telah dikalibrasi, termasuk yang serupa exoskeleton, meskipun tentu biayanya cukup tinggi.

Selain itu, kami juga mengumpulkan data dari perspektif tanpa badan dan dari sudut pandang orang pertama, membentuk dataset yang lebih besar—ini adalah semi-sintetik, antara data nyata dan data sintetis.

Selain itu, ada juga data dari internet yang biayanya lebih rendah.

All-Weather Tech: Bisa jelaskan secara spesifik tentang pengumpulan data tanpa badan?

Tang Wenbin: Maksud dari “tanpa badan” adalah data yang dikumpulkan dari perangkat seperti sarung tangan atau penjepit genggam, tanpa lengan robot atau tubuh robot. Jadi, hanya menggunakan perangkat ujung akhir saja. Saya merekam posisi dan status perangkat ujung tersebut secara kasar. Metode pengumpulan data ini juga dikenal sebagai UMI (Unmanned Manipulation Interface).

Hari ini, data dari sudut pandang orang pertama yang kita bahas juga banyak, misalnya merekam proses operasi melalui kacamata, ini juga termasuk pengumpulan data tanpa badan.

All-Weather Tech: Data dari kacamata AI setiap orang pasti bersifat privasi, dan mungkin tidak ada yang mau membagikan data kacamata mereka untuk dikumpulkan. Bagaimana Anda menyelesaikan masalah ini?

Tang Wenbin: Memang, jika saya pengguna kacamata, saya juga tidak ingin data saya dibagikan ke orang lain. Tapi untuk pelatihan, kita bisa mempekerjakan pihak ketiga yang melakukan pengumpulan data, mereka memakai kacamata secara rutin untuk merekam proses kerja, dan data itu akan terekam.

Tentu saja, kami juga berharap fungsi kacamata itu sendiri bisa lebih canggih, misalnya memiliki visual stereo dan multi-misi. Di masa depan, kami mungkin juga akan menambahkan perangkat seperti gelang dan sarung tangan untuk pengumpulan data.

Secara keseluruhan, objek pengumpulan data kami beragam. Pertama, robot itu sendiri, yang bisa dikendalikan dari jarak jauh; kedua, perangkat tanpa badan seperti penjepit genggam, yaitu “tubuh manusia + ujung robot”; ketiga, pengumpulan data yang sepenuhnya berfokus pada manusia; keempat, deskripsi tentang dunia fisik.

All-Weather Tech: Misalnya, dalam sensor ujung, data utama yang dikumpulkan adalah data kekuatan (force)?

Tang Wenbin: Tidak hanya kekuatan, kami juga ingin data multimodal, misalnya menambahkan sudut pandang visual.

Dalam praktiknya, karena lengan bisa menghalangi sebagian data, kami bisa memasang kamera di bagian mata, dan di kedua pergelangan tangan juga bisa ada dua kamera, membentuk data dari berbagai sudut pandang.

All-Weather Tech: Apakah biaya pengumpulan data seperti ini sangat tinggi?

Tang Wenbin: Itu sebenarnya adalah masalah kompleks antara kualitas data, kuantitas, dan keberagaman. Jika harus mengumpulkan semua modul data, biayanya akan sangat tinggi. Jadi, kami menggunakan strategi pengumpulan terdistribusi: beberapa data kami usahakan lengkap, sementara yang lain, demi menekan biaya, meningkatkan kuantitas dan kecepatan, meskipun tidak sepenuhnya lengkap.

Ini soal kompromi. Kami memiliki alat pengumpulan sendiri dan juga bekerja sama secara luas dengan industri lain.

All-Weather Tech: Pada Februari tahun ini, Anda bekerja sama dengan Huachin Technology meluncurkan robot pengumpul data. Bisa ceritakan tentang robot ini?

Tang Wenbin: Robot ini terutama digunakan untuk keperluan riset, bentuknya mirip robot ALOHA, dan ada juga yang mengerjakan hal serupa. (Catatan: ALOHA adalah sistem perangkat keras open-source berbiaya rendah untuk teleoperasi bimanual, digunakan untuk kendali jarak jauh dua tangan secara murah dan efisien.)

Namun, saat ini, ada dua masalah utama dengan robot pengumpul data di pasar:

Pertama, keandalan. Produk sering mengalami kerusakan, yang berdampak negatif pada pekerjaan riset dan menurunkan efisiensi.

Kami belum bisa memastikan stabilitas jangka panjang produk, jadi kami menyederhanakan proses perbaikan, mendesain struktur modular yang bisa dilepas pasang. Jika satu bagian rusak, pengguna bisa cepat menggantinya. Banyak sambungan tidak pakai sekrup, melainkan tombol putar, jadi mungkin hanya butuh 30 detik untuk memperbaiki.

Kedua, biaya yang masih tinggi. Jadi, kami bekerja sama dengan Huachin untuk mendesain produk serupa ALOHA, yang mendukung operasi master-slave dan drag-and-drop. Intinya, agar cepat diperbaiki dan murah harganya. (Catatan: mode master-slave berarti operator mengendalikan lengan utama untuk menggerakkan lengan kedua secara real-time, dengan gerakan yang direplikasi tanpa delay, memungkinkan pengumpulan data operasi dua lengan yang presisi dan biaya rendah.)

All-Weather Tech: Apakah perusahaan lain pernah membeli robot ini untuk pengumpulan data?

Tang Wenbin: Ya, karena masalah utama di industri cukup seragam, banyak perusahaan membeli produk dari kompetitor untuk digunakan bersama.

Model Dunia Tidak Bisa Ditempuh

All-Weather Tech: Bisa ceritakan pandangan Anda tentang model dunia dan VLA?

Tang Wenbin: Perlu dibedakan dua hal: memahami dunia dan menghasilkan dunia itu berbeda.

Kemampuan model besar yang kita bahas saat ini, secara umum, adalah kemampuan mereka memahami dunia. Model dunia sebenarnya berusaha memprediksi masa depan, yaitu apa yang mungkin terjadi di frame berikutnya. Sedangkan VLA (visual-language-action) intinya adalah berinteraksi dengan dunia.

Model-model ini memiliki kesamaan, tetapi juga mampu menyelesaikan masalah dari sudut pandang berbeda.

Kami percaya strategi terbaik adalah menggabungkan keduanya. Hanya dengan begitu, kita bisa benar-benar memahami dan menghasilkan konten, serta memahami dan berinteraksi dengan dunia.

Secara teori, jika kita mampu memprediksi masa depan dunia, kita bisa secara balik menarik kesimpulan tentang bagaimana harus bertindak. Sebaliknya, jika kita tahu bagaimana bertindak, itu berarti kita mampu memprediksi perkembangan masa depan.

Jadi, dalam kerangka teknologi saat ini, model dunia dan VLA digabungkan menjadi satu, yaitu kita berharap satu model bisa memahami dunia sekaligus memprediksi apa yang akan terjadi selanjutnya.

Dengan begitu, model tidak hanya mampu melakukan aksi, tetapi juga mampu memprediksi bagaimana dunia akan berubah setelah aksi tersebut dilakukan.

All-Weather Tech: Apakah kerangka teknologi industri berbeda dari Anda?

Tang Wenbin: Memang, saat ini beberapa perusahaan mengusung hanya menggunakan model dunia. Ada pandangan bahwa dengan model dunia menghasilkan data, robot bisa belajar meniru, sehingga muncul sumber data tak terbatas.

Namun, saya sendiri merasa jalan ini tidak akan berhasil. Jika model dunia sudah tercapai, masalah menghasilkan data sudah terselesaikan, dan orang tidak perlu lagi melatih robot dari data yang dihasilkan.

Jalan lain yang banyak dilakukan oleh rekan-rekan adalah memprediksi model dunia masa depan, lalu dari model itu menarik aksi yang diperlukan. Pendekatan ini melibatkan memprediksi skenario atau kondisi dunia di masa depan, lalu menghitung rangkaian aksi yang sesuai. Paradigma ini sebenarnya adalah gabungan dari kedua pendekatan yang saya sebutkan tadi, yaitu model yang digabungkan dan bersatu.

All-Weather Tech: Dari segi skenario, karena saat ini pabrik sudah sangat otomatis, apakah robot yang masuk pabrik tidak lagi berguna?

Tang Wenbin: Memang, solusi otomatisasi pabrik saat ini sudah cukup matang. Tapi, kami ingin menyelesaikan masalah yang sebelumnya tidak bisa diatasi, atau yang biayanya sangat tinggi.

Namun, banyak jalur otomatisasi saat ini tidak terlalu membutuhkan kemampuan generalisasi tinggi, misalnya objek, lingkungan, dan tugasnya tidak perlu digeneralisasi. Contohnya, SKU-nya hanya beberapa, dan kondisi pencahayaan serta lingkungan sudah diatur.

Masalah utama yang belum bisa diatasi saat ini adalah keberagaman objek dan perubahan lingkungan yang cepat, bahkan banyak tugas berbeda yang harus diselesaikan.

Misalnya, dalam skenario logistik, robot utama saat ini hanya memindahkan barang, tetapi belum mampu melakukan operasi tangan yang baik, karena ini sangat membutuhkan generalisasi.

Contohnya, saat membeli satu botol soda dan satu bungkus keripik, operator akan membungkus masing-masing. Karena variasi barang sangat banyak dan kondisi lingkungan selalu berubah, otomatisasi sulit untuk mengatasi ini.

Begitu juga dalam pengemasan, misalnya botol sabun mandi, kita biasanya menemukan lapisan plastik di leher botol untuk mencegah kebocoran. Saat proses, operator berdasarkan pengalaman membungkusnya dengan plastik film, lalu memasukkannya ke dalam kantong busa dan menempelkan label. Ini sulit dilakukan otomatis.

Saat ini, kami sedang melakukan beberapa percobaan di bidang logistik dan industri.

All-Weather Tech: Apakah Anda lebih suka mengembangkan secara terpusat di satu skenario tertentu, atau ingin mengembangkan di banyak skenario sekaligus?

Tang Wenbin: Ini dua hal berbeda. Melihat perkembangan model besar, terutama kemajuan terbaru, ada tren umum. Jika kita hanya membangun model vertikal tertentu, itu tidak akan mampu mencapai generalisasi sejati, dan itu tidak akan berhasil.

Oleh karena itu, dari sudut pandang model, kita harus berkomitmen pada generalisasi dan kemampuan teknologi yang lebih umum.

Namun, dari sudut penerapan di lapangan, kita harus mengimplementasikan satu per satu skenario secara bertahap.

Jadi, internal kami sering menekankan bahwa keberhasilan produk bergantung pada dua hal utama: pertama, solusi harus mampu menutup seluruh siklus, menyelesaikan semua masalah dan anomali pelanggan, memenuhi semua kebutuhan proses; kedua, biaya harus terkendali agar pelanggan merasa kerjasama ini menguntungkan.

Hanya jika kedua syarat ini terpenuhi, pelanggan akan mempertimbangkan untuk mengaplikasikan produk secara skala besar.

Setiap kali kami menerapkan satu skenario, kami harus memahami dengan jelas nilai bagi pelanggan dan memastikan kedua poin tersebut tercapai. Ini adalah proses yang berlangsung dari tahun ke tahun.

Kami menggambarkan proses ini sebagai hubungan antara pengembangan model dan penerapan di lapangan, yang membentuk sudut 45 derajat—berkaitan tetapi tidak sepenuhnya terkait.

Tentu saja, model kami harus berkembang ke arah yang lebih umum.

Harus ada rasa hormat terhadap skenario

All-Weather Tech: Jadi, Anda mendukung jalur robot serba guna?

Tang Wenbin: Saya pribadi percaya bahwa model bisa bersifat umum, tetapi hardware sangat sulit diwujudkan secara serba guna.

Sebenarnya, kedua tangan kami sangat fleksibel: satu bisa melakukan operasi halus, dan juga mampu mengangkat barang seberat 20 kg, bahkan lebih hebat lagi, bisa mengangkat 50 kg.

Namun, karena batasan fisika dan material, lengan robot yang mampu mengangkat barang 2 kg pasti berbeda dengan yang mampu mengangkat 20 kg, karena daya dan densitas daya mereka berbeda.

Jadi, kami berpendapat bahwa jika Anda menggunakan desain serba guna dan menerapkannya ke skenario tertentu, mudah sekali menemukan kekurangan—baik kekurangan desain maupun kelebihan desain.

Kekurangan desain berarti beban berat tidak bisa dilalui, atau ruang pemasangan sensor terlalu sempit sehingga tidak bisa menyelesaikan masalah; mungkin saja bisa, tapi itu over-engineered, dan harganya jadi sangat mahal.

Misalnya, lengan robot beroda dengan pusat gravitasi tinggi akan lebih cepat, tetapi begitu kecepatannya meningkat, sulit berhenti, dan bisa jatuh.

Dalam situasi seperti ini, kita mungkin akan menyadari bahwa diam saja bisa jadi pilihan yang lebih baik, misalnya kendaraan bergerak mengantarkan barang.

Jadi, dalam beberapa skenario, over-engineering bisa terjadi.

Logika internal kami adalah membuat model bersifat umum dan mampu menyesuaikan berbagai platform hardware.

All-Weather Tech: Jadi, investor saat ini lebih tertarik pada kemampuan model Anda?

Tang Wenbin: Ya, tim kami unik karena tidak hanya fokus pada pengembangan robot, tetapi juga mendalami pemahaman tentang model. Kami memiliki pengalaman yang kaya di bidang logistik bersama Megvii, dan skala yang cukup besar, sehingga sangat memahami produk. Selain itu, kami juga memiliki tim profesional yang fokus pada pengoptimalan model.

All-Weather Tech: Karena banyak perusahaan di industri tertentu yang sangat memahami kebutuhan di bidang mereka, tetapi Anda memulai dari bisnis model, jadi mungkin pemahaman tentang kebutuhan skenario kurang mendalam?

Tang Wenbin: Sebenarnya, saat di Megvii, kami sudah mengerjakan banyak skenario, jadi saya rasa kami cukup teredukasi.

Ini lebih soal mindset. Industri robot membutuhkan dua kelompok orang: satu yang lebih paham teknologi, dan satu yang lebih paham skenario. Kami sebenarnya berada di tengah-tengah.

Orang yang hanya fokus pada teknologi seringkali membuat asumsi tentang skenario, mereka pikir “tidak jauh-jauh dari ini saja”. Tapi, kenyataannya, setan tersembunyi dalam detail. Misalnya, saat muncul masalah, proses produksi tidak boleh berhenti, jadi harus ada prosedur penanganan gangguan yang lengkap.

Oleh karena itu, orang yang bekerja di bidang teknologi harus memiliki rasa hormat terhadap skenario.

Namun, banyak juga masalah di industri. Secara historis, banyak rekan yang awalnya percaya bahwa teknologi bisa segalanya, tetapi begitu melibatkan AI dan kecerdasan, mereka berharap kita bisa menyelesaikan semua masalah. Ketika mereka menyadari ada masalah yang tidak bisa diselesaikan, mereka sangat kecewa dan kembali ke metode tradisional berbasis aturan.

Namun, perkembangan model saat ini tidak berarti bisa segalanya, dan juga tidak berarti tidak bisa apa-apa. Kita berada di tahap tengah, dengan kemiringan kurva yang sangat tinggi, dan perkembangan yang pesat.

Jadi, kita sangat membutuhkan orang yang mampu menilai skenario, memahami algoritma dan kecepatan perkembangannya. Selain itu, perlu juga orang yang mampu merancang langkah-langkah untuk menyelesaikan masalah saat ini agar proyek bisa segera berjalan.

Semua pekerjaan yang kita lakukan saat ini sebenarnya adalah memenuhi kebutuhan. Tentu saja, kita punya batasan pandangan sendiri.

Oleh karena itu, saya menganjurkan belajar secara luas dan mengamati dari berbagai sudut, tetapi juga harus punya standar penilaian sendiri, memilih skenario yang bisa bertahan lama.

All-Weather Tech: Jadi, bagaimana Anda menentukan target pelanggan? Apakah perusahaan robot, atau pihak yang menerapkan skenario?

Tang Wenbin: Sebenarnya, lebih ke pihak yang menerapkan skenario.

Sejujurnya, baik di dalam maupun luar negeri, model yang digunakan oleh banyak perusahaan belum matang. Saat ini, mereka belum mampu langsung menempatkan model ke perangkat robot dan menggunakannya setelah pelatihan sederhana.

Saya percaya, dalam kondisi model yang belum matang, untuk mewujudkan penerapan skenario, integrasi vertikal sangat diperlukan.

Kalau kita sendiri saja tidak bisa menguasai skenario itu, lalu berharap mitra dan pelanggan bisa menyelesaikan, itu adalah harapan yang tidak realistis. Saya yakin suatu saat nanti, kita akan mengerjakan beberapa skenario vertikal sendiri, dan banyak skenario lain bisa diselesaikan melalui platform terbuka bersama mitra kita. Mereka bisa memakai hardware kita, atau hanya menggunakan “otak” kita, untuk mengeksplorasi lebih banyak kemungkinan secara mandiri.

All-Weather Tech: Jadi, alasan Anda membuka sumber model adalah agar lebih banyak orang bisa bergabung?

Tang Wenbin: Ada dua alasan utama untuk open-source. Pertama, kami ingin lebih banyak orang memakai kerangka dan model kami, sehingga kita bisa bersama-sama mengeksplorasi lebih banyak skenario dan mendorong penerapan teknologi. Kedua, meskipun saat ini industri sedang panas, tingkat kematangan model secara keseluruhan masih awal, dan saling bertukar pengalaman serta mempercepat kemajuan sangat penting.

All-Weather Tech: Anda sebelumnya menyebutkan target utama tahun 2026 adalah menempatkan 1.000 perangkat yang mampu beroperasi secara berkelanjutan di setiap skenario. Bisa ceritakan perkembangan pencapaian target ini?

Tang Wenbin: Mungkin baru bisa berjalan secara terus-menerus di paruh kedua tahun ini. Saat ini, kami masih dalam tahap pengujian POC.

Kami cukup percaya diri dengan potensi massal dari skenario internal kami.

Sebenarnya, agar robot bisa berjalan terus-menerus, harus ada mekanisme toleransi kesalahan. Jujur saja, metode berbasis model saat ini belum bisa mencapai tingkat akurasi 100%.

Kalau tugas gagal, apa yang harus dilakukan? Pertanyaan ini harus punya jawaban. Kami perlu mencari cara untuk mengalihkan tugas, agar tugas yang gagal bisa dipulihkan. Kami juga harus menilai dampak kegagalan ini terhadap perusahaan dan apakah dampaknya dapat diterima.

Setelah menerapkan solusi cadangan, kami juga harus memastikan ROI dari seluruh sistem.

All-Weather Tech: Kalau bicara ROI, biasanya pelanggan akan langsung bertanya berapa banyak penghematan biaya yang bisa mereka raih dari lini produksi?

Tang Wenbin: Biasanya, pelanggan akan langsung menanyakan kapan mereka akan balik modal.

Kalau proyek membutuhkan waktu lebih dari lima tahun untuk balik modal, maka tidak perlu dilanjutkan.

Kalau diperkirakan dalam dua sampai tiga tahun sudah balik modal, langsung saja jalan. Dalam lingkungan B2B saat ini, sebagian besar keputusan didasarkan pada analisis rasional, menghitung berapa banyak efisiensi yang bisa ditingkatkan. Misalnya, robot bisa memperpanjang waktu operasional beberapa proses produksi, memanfaatkan peralatan yang ada secara lebih efisien, dan membawa nilai tambah bagi pelanggan.

All-Weather Tech: Bisa bocorkan rencana pembaruan model selanjutnya?

Tang Wenbin: Tahun ini, fokus utama kami adalah pada kemampuan generalisasi.

All-Weather Tech: Baru memulai usaha di bidang model embodied tahun lalu, apakah menurut Anda ini terlambat?

Tang Wenbin: Sebenarnya, sudah bertahun-tahun yang lalu kami ingin membuat robot serba guna. Saat itu, kami merasa teknologi belum cukup matang. Tapi, seiring perkembangan model besar seperti DeepSeek, saya jadi lebih percaya diri.

All-Weather Tech: Kalau Anda harus memberi satu kata kunci untuk industri kecerdasan embodied tahun 2026, apa itu?

Tang Wenbin: Saya ingin memberi dua kata: pertama, peningkatan kemampuan model; kedua, keberlangsungan skenario.

Saya rasa model saat ini masih dalam tahap awal, tetapi kecepatan perkembangannya sangat pesat. Jadi, kita harus berusaha meningkatkan algoritma model, termasuk dalam hal adaptasi terhadap objek, lingkungan, dan generalisasi tugas. Kemampuan generalisasi model sangat penting. Kedua, dalam hal penerapan skenario, saya rasa POC saja tidak cukup; itu hanya awal. Fokusnya adalah bagaimana menjaga keberlangsungan operasional di skenario nyata, dan tahun ini saatnya untuk itu.

Peringatan risiko dan klausul pelepasan tanggung jawab

Pasar memiliki risiko, berinvestasi harus hati-hati. Artikel ini tidak merupakan saran investasi pribadi, dan tidak mempertimbangkan tujuan investasi, kondisi keuangan, atau kebutuhan khusus pengguna. Pengguna harus menilai apakah pendapat, pandangan, atau kesimpulan dalam artikel ini sesuai dengan kondisi mereka. Dengan berinvestasi berdasarkan hal ini, tanggung jawab sepenuhnya di tangan pengguna.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan