Catatan kunjungan seorang akademisi Barat ke Laboratorium AI China: rendah hati, terbuka, tidak membahas filosofi, hanya ingin melatih model yang lebih baik

robot
Pembuatan abstrak sedang berlangsung

Penulis: Florian Brand

Terjemahan: Deep潮 TechFlow

Deep潮 Panduan: Latar belakang artikel ini adalah SAIL (sebuah aliansi media yang menggabungkan penulis AI teratas di Substack, termasuk Nathan Lambert, Sebastian Raschka, ChinaTalk, dan lain-lain) mengadakan kunjungan ke laboratorium AI di Tiongkok, penulis Florian ikut serta dalam rombongan ke sisi gelap bulan, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant, Modda, Zero One Wanwu, Yushu dan lebih dari selusin perusahaan lainnya, dan menulis pengalaman ini.

Florian Brand adalah mahasiswa doktor di Universitas Trier Jerman dan Pusat Penelitian Kecerdasan Buatan Jerman (DFKI), fokus penelitiannya adalah aplikasi dan evaluasi model bahasa besar.

Tidak bisa disebut "sangat terkenal", tetapi cukup dikenal di komunitas AI open source, dan dari sudut pandang praktisi AI asing melihat ekosistem AI di China juga cukup menarik.

Isi:

Sekitar 10 hari yang lalu, saya berkesempatan mengunjungi laboratorium AI di Tiongkok bersama rekan-rekan dari SAIL. Sebagai orang yang pertama kali mengunjungi Tiongkok dan Amerika Serikat dalam enam bulan, saya menemukan perbedaan kedua tempat sangat memikat, tetapi yang lebih menarik adalah kesamaannya.

Yang paling meninggalkan kesan mendalam bagi saya adalah bahwa para peneliti AI yang saya temui sangat rendah hati.

Mereka sangat menghargai laboratorium dan rekan sejawat lainnya. DeepSeek sering disebutkan, mungkin karena beberapa hari sebelum kunjungan kami mereka baru saja merilis sebuah model, dan orang-orang berbicara tentang makalah DeepSeek dengan kekaguman yang tulus.

Banyak peneliti adalah teman dekat satu sama lain, berasal dari universitas yang sama atau berbagi asal yang sama. Mereka secara terbuka membahas pekerjaan mereka, dan hasil penelitian mereka akan dipublikasikan sebagai makalah beberapa bulan kemudian.

Ini adalah salah satu perbedaan terbesar dengan komunitas AI Barat. Di AS, suasananya sering lebih seperti permainan zero-sum. Laboratorium sangat berhati-hati dalam penempatan posisi. Para peneliti memikirkan kompetisi, beberapa dari mereka menilai diri mereka sangat tinggi. Pemimpin saling menghina dan menyerang dalam memo yang bocor. Perbedaan ini mungkin bisa dijelaskan secara faktual: laboratorium terkemuka di AS bersifat tertutup, sementara banyak laboratorium di China bersifat terbuka. Laboratorium di China juga merasa waspada terhadap Doubao ByteDance, yang merupakan chatbot paling banyak digunakan dan bersifat tertutup, sehingga memiliki keunggulan besar.

Sementara itu, suasana secara keseluruhan sangat mirip dengan San Francisco. Para peneliti sangat online, membaca banyak di Twitter dan Xiaohongshu, yang semakin populer. Mereka semua menggunakan Claude Code atau CLI mereka sendiri untuk membangun model berikutnya. Beberapa memantau pelatihan saat rapat, mengamati kenaikan kurva reward. Mereka memikirkan perluasan skala lebih jauh, mengeluh tentang kekurangan daya komputasi. Mereka frustrasi dengan kondisi benchmark saat ini.

Fokus utama mereka adalah melatih model yang lebih baik. Berbeda dengan San Francisco, di mana para peneliti memikirkan dampak politik atau filosofis AI. Mereka tidak memikirkan pengangguran massal, kelas bawah permanen, atau apakah model mereka memiliki kesadaran. Mereka hanya ingin melatih model yang hebat.

Ketika mendengar bahwa Anda menggunakan model mereka, mata mereka bersinar. Mereka ingin memperbaiki semua kekurangan model saat ini di generasi berikutnya. Mereka bekerja keras semalaman untuk merilis model, dan tetap muncul di kantor setelahnya.

Sebagian besar peneliti yang saya temui sangat muda, banyak yang berusia sekitar 20-an atau 25 tahun. Beberapa adalah mahasiswa sarjana, tetapi lebih umum adalah mereka yang sedang menempuh PhD dan bekerja di industri sekaligus. Mereka sepakat bahwa, dibandingkan akademik, industri saat ini lebih menarik, dan saya sangat setuju karena saya pernah melakukan hal yang sama. Laboratorium sangat fokus merekrut talenta seperti ini, aktif merekrut magang dan mahasiswa pascasarjana; ini tidak dilakukan oleh laboratorium Barat.

Semangat optimisme para peneliti ini juga meluas ke masyarakat umum, yang tampaknya lebih optimis tentang teknologi dan masa depan AI serta robot. Dalam perjalanan, ada yang menceritakan kisah orang tua dan kakek nenek mereka yang menggunakan Doubao dan DeepSeek untuk berbagai hal, termasuk membahas teorema matematika. Ini sangat berbeda dari Barat, di mana masyarakat umum cenderung antipati terhadap AI.

Secara keseluruhan, perjalanan ini memberi saya sedikit gambaran tentang ekosistem ini. Tidak mungkin memahami budaya peradaban sebesar ini dalam beberapa hari. Sebagai pendukung kuat ekosistem AI terbuka dan penelitian terbuka, saya sangat optimis tentang masa depan keduanya, dan berharap akan banyak kolaborasi internasional di masa depan.

Saya ingin berterima kasih kepada semua orang luar biasa yang saya temui di sisi gelap bulan, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant Lingxi, Modda, Zero One Wanwu, Yushu, dan tempat lain. Terima kasih atas waktu dan sambutan hangat kalian. Juga terima kasih kepada SAIL yang mengatur perjalanan ini, dan semua penulis serta jurnalis yang terlibat. Saya sangat bersyukur bisa bertemu begitu banyak orang berbakat dan berambisi dalam waktu yang singkat ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar