CEO Google DeepMind, pemenang Nobel Kimia Demis Hassabis, mengunjungi Y Combinator, membahas kemajuan kunci menuju AGI, memberi saran kepada pengusaha tentang bagaimana tetap unggul, serta di mana kemungkinan munculnya terobosan ilmiah besar berikutnya.

Judgment paling praktis bagi pengusaha teknologi mendalam adalah, jika Anda memulai proyek teknologi mendalam jangka sepuluh tahun hari ini, Anda harus memasukkan kemunculan AGI ke dalam perencanaan. Selain itu, dia juga mengungkapkan bahwa Isomorphic Labs (perusahaan farmasi AI yang dipisahkan dari DeepMind) akan mengumumkan berita besar dalam waktu dekat.

Kutipan Paling Berkesan

Jalur dan garis waktu AGI

·「Komponen teknologi yang ada saat ini hampir pasti akan menjadi bagian dari arsitektur akhir AGI.」

·「Pembelajaran berkelanjutan, penalaran jangka panjang, dan beberapa aspek memori masih belum terselesaikan, AGI harus menyelesaikan semuanya.」

·「Jika garis waktu AGI Anda sekitar tahun 2030 seperti saya, dan Anda memulai proyek teknologi mendalam hari ini, Anda harus mempertimbangkan bahwa AGI akan muncul di tengah jalan.」

Memori dan jendela konteks

·「Jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Tapi masalahnya, kita memasukkan semua hal ke dalamnya, termasuk informasi yang tidak penting dan salah, dan saat ini cara ini cukup kasar.」

·「Jika harus memproses aliran video real-time dan menyimpan semua token, satu juta token sebenarnya cukup untuk sekitar 20 menit.」

Kekurangan penalaran

·「Saya suka bermain catur dengan Gemini. Kadang-kadang dia sadar ini langkah buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya dia berputar-putar dan tetap melakukan langkah buruk itu. Tapi sistem penalaran yang akurat seharusnya tidak mengalami hal ini.」

·「Di satu sisi dia bisa menyelesaikan soal setingkat medali emas IMO, di sisi lain, jika ditanya dengan cara berbeda, dia bisa melakukan kesalahan matematika dasar sekolah dasar. Dalam hal introspeksi proses berpikirnya, sepertinya masih ada yang kurang.」

Agen dan kreativitas

·「Untuk mencapai AGI, Anda harus memiliki sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Agen adalah jalur itu, saya rasa kita baru mulai.」

·「Saya belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak peringkat toko aplikasi. Dengan usaha saat ini, itu seharusnya mungkin, tapi belum terjadi. Ini menunjukkan bahwa alat atau prosesnya masih kurang.」

Distilasi dan model kecil

·「Asumsi kami adalah, setelah model Pro terbaru dirilis selama setengah tahun hingga satu tahun, kemampuannya dapat dikompresi ke dalam model yang sangat kecil dan dapat dijalankan di perangkat edge. Saat ini, kita belum mencapai batas densitas informasi secara teoretis.」

Penemuan ilmiah dan “Tes Einstein”

·「Kadang-kadang saya menyebutnya ‘Tes Einstein’, yaitu apakah bisa melatih sistem menggunakan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil yang dibuat Einstein pada tahun 1905, termasuk relativitas khusus. Jika bisa, sistem ini tidak jauh dari penemuan sesuatu yang benar-benar baru.」

·「Menyelesaikan satu masalah hadiah Millennium Prize sudah luar biasa. Tapi yang lebih sulit adalah, apakah bisa mengajukan satu set masalah Millennium Prize baru yang dianggap oleh matematikawan top sama mendalam dan layak dipelajari seumur hidup.」

Saran untuk startup teknologi mendalam

·「Mengikuti masalah sulit dan masalah sederhana sebenarnya tidak jauh berbeda, hanya caranya berbeda. Hidup ini singkat, lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain.」

Jalur Realisasi AGI

Gary Tan: Waktu Anda memikirkan AGI hampir lebih lama dari semua orang. Melihat paradigma saat ini, menurut Anda, berapa banyak arsitektur akhir AGI yang sudah kita miliki? Apa yang secara fundamental masih hilang?

Demis Hassabis: Pretraining skala besar, RLHF, chain of thought, saya yakin semuanya akan menjadi bagian dari arsitektur akhir AGI. Teknologi ini sudah terbukti banyak hal sampai hari ini. Saya sulit membayangkan dalam dua tahun ke depan kita akan menemukan ini jalan buntu, itu tidak masuk akal bagi saya. Tapi, di atas yang sudah ada, mungkin masih kurang satu atau dua hal. Continual learning, reasoning jangka panjang, dan beberapa aspek memori, masih ada masalah yang belum terselesaikan.

AGI harus diselesaikan semuanya. Mungkin teknologi yang ada ditambah inovasi bertahap bisa mencapai tingkat itu, tapi juga mungkin masih ada satu atau dua titik kunci besar yang perlu ditembus. Saya rasa tidak lebih dari satu atau dua. Penilaian pribadi saya tentang keberadaan titik kunci yang belum terpecahkan ini adalah probabilitas sekitar 50:50. Jadi di Google DeepMind, kami mengembangkan kedua jalur tersebut.

Gary Tan: Saya berinteraksi dengan banyak sistem Agen, yang paling mengejutkan saya adalah, dasar-dasarnya selalu sama, berulang-ulang dengan bobot yang sama. Jadi konsep pembelajaran berkelanjutan sangat menarik, karena saat ini kita hampir menempelkan semuanya secara temporer, seperti yang dilakukan dalam siklus “dreaming” malam hari.

Demis Hassabis: Betul, siklus mimpi itu keren. Kami pernah memikirkan ini dalam integrasi memori situasional. Saya meneliti tentang bagaimana hippocampus secara elegan mengintegrasikan pengetahuan baru ke dalam sistem pengetahuan yang sudah ada. Otak sangat baik dalam hal ini.

Proses ini dilakukan saat tidur, terutama selama tidur REM, dengan memutar ulang pengalaman penting untuk belajar. Program Atari awal kami, DQN (DeepMind 2013, jaringan Q deep yang pertama kali menggunakan reinforcement learning mendalam untuk mencapai level manusia di game Atari), mampu menguasai game Atari, salah satu kuncinya adalah pengalaman replay.

Ini belajar dari ilmu saraf, memutar ulang jalur keberhasilan secara berulang. Itu sudah sejak 2013, di bidang AI termasuk kuno, tapi saat itu sangat penting.

Saya setuju dengan Anda, saat ini kita memang menempelkan semuanya secara kasar. Memasukkan semua ke dalam jendela konteks. Rasanya tidak benar. Secara teori, kita bisa memiliki jendela konteks jutaan atau puluhan juta token, dan memori bisa sempurna, tapi biaya pencarian dan retrieval tetap ada. Dalam pengambilan keputusan saat ini, menemukan informasi yang benar-benar relevan tidak mudah, meskipun kita bisa menyimpan semuanya. Jadi saya rasa bidang memori masih punya ruang inovasi besar.

Gary Tan: Jujur saja, jendela konteks satu juta token sudah jauh lebih besar dari yang saya bayangkan, dan bisa melakukan banyak hal.

Demis Hassabis: Untuk sebagian besar skenario penggunaannya, itu sudah cukup besar. Tapi bayangkan, jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Masalahnya, kita memasukkan semua ke dalamnya, termasuk informasi tidak penting dan salah, dan cara ini cukup kasar. Kalau harus memproses aliran video real-time dan menyimpan semua token, satu juta token hanya cukup untuk sekitar 20 menit. Tapi jika ingin sistem memahami kehidupan Anda selama satu atau dua bulan, itu masih jauh dari cukup.

Gary Tan: DeepMind selalu sangat fokus pada reinforcement learning dan pencarian, filosofi ini seberapa dalam terintegrasi dalam pembangunan Gemini? Apakah reinforcement learning masih diremehkan?

Demis Hassabis: Mungkin memang masih diremehkan. Perhatian terhadapnya naik turun. Sejak hari pertama di DeepMind, kami mengerjakan sistem Agen. Semua pekerjaan di Atari dan AlphaGo, pada dasarnya adalah agen reinforcement learning, sistem yang mampu mencapai tujuan, membuat keputusan, dan merencanakan secara mandiri. Tentu saja, waktu itu kami memilih bidang game karena kompleksitasnya bisa dikendalikan, lalu secara bertahap mengerjakan game yang lebih kompleks, seperti AlphaGo, kemudian AlphaStar, hampir semua game yang bisa kami lakukan sudah kami kerjakan.

Pertanyaan berikutnya adalah, apakah model ini bisa digeneralisasi menjadi model dunia atau model bahasa, bukan hanya model game. Dalam beberapa tahun terakhir, kami memang mengerjakan hal ini. Saat ini, semua model terdepan yang ada, pola pikir dan chain of thought mereka, pada dasarnya adalah pengulangan dari apa yang AlphaGo mulai ciptakan dulu.

Saya rasa banyak pekerjaan yang kami lakukan dulu sangat relevan dengan apa yang kita lakukan hari ini, kita sedang meninjau kembali ide-ide lama, menggunakan skala yang lebih besar dan cara yang lebih umum, termasuk Monte Carlo tree search dan berbagai metode reinforcement learning lainnya. Ide-ide dari AlphaGo dan AlphaZero sangat terkait dengan model dasar saat ini, dan saya rasa sebagian besar kemajuan dalam beberapa tahun ke depan akan berasal dari sini.

Distilasi dan model kecil

Gary Tan: Sekarang, untuk menjadi lebih pintar, kita membutuhkan model yang lebih besar, tapi di saat yang sama, teknik distilasi juga berkembang, sehingga model kecil bisa sangat cepat. Model Flash kalian sangat kuat, mampu mencapai sekitar 95% dari performa model terdepan, tapi harganya hanya sepersepuluh. Benar begitu?

Demis Hassabis: Saya rasa ini salah satu keunggulan utama kami. Anda harus membangun model terbesar dulu untuk mendapatkan kemampuan terdepan. Salah satu keunggulan kami adalah mampu dengan cepat mendistilasi dan mengompresi kemampuan tersebut ke dalam model yang semakin kecil. Metode distilasi ini sebenarnya kami yang ciptakan, dan kami masih menjadi yang terdepan di dunia. Selain itu, ada motivasi bisnis yang kuat untuk melakukan ini. Kami mungkin adalah platform AI aplikasi terbesar di dunia.

Dengan AI Overviews dan AI Mode, serta Gemini, saat ini setiap produk Google, termasuk Maps, YouTube, dan lain-lain, mengintegrasikan Gemini atau teknologi terkait. Ini menyentuh ratusan juta pengguna, dan produk-produk dengan miliaran pengguna. Mereka harus sangat cepat, efisien, biaya rendah, dan latensi sangat rendah. Ini memberi kami motivasi besar untuk mengoptimalkan Flash dan model Flash-Lite yang lebih kecil agar sangat efisien, dan saya berharap ini akhirnya bisa melayani berbagai kebutuhan pengguna.

Gary Tan: Saya penasaran, seberapa pintar model kecil ini sebenarnya? Apakah distilasi memiliki batas? Apakah model 50B atau 400B bisa secerdas model terdepan saat ini?

Demis Hassabis: Saya tidak merasa kita sudah mencapai batas teori informasi, setidaknya saat ini tidak ada yang tahu. Mungkin suatu hari akan menemui batas densitas informasi tertentu, tapi asumsi kami saat ini adalah, setelah model Pro terbaru dirilis selama setengah tahun sampai satu tahun, kemampuannya bisa dikompresi ke dalam model yang sangat kecil dan bisa dijalankan di perangkat edge.

Anda juga bisa melihat ini di model Gemma kami, Gemma 4, yang menunjukkan performa sangat kuat dalam ukuran yang sama. Ini semua berkat banyak teknik distilasi dan optimisasi efisiensi model kecil. Jadi saya benar-benar tidak melihat batas teori, dan saya rasa kita masih jauh dari batas itu.

Gary Tan: Saat ini, fenomena yang cukup ekstrem adalah para insinyur mampu melakukan pekerjaan sekitar 500 sampai 1000 kali lipat dari enam bulan lalu. Ada orang di ruangan ini yang melakukan pekerjaan setara dengan insinyur Google tahun 2000-an, 1000 kali lipat. Steve Yegge pernah membahas ini.

Demis Hassabis: Saya merasa sangat bersemangat. Model kecil punya banyak kegunaan. Salah satunya biaya rendah dan kecepatan tinggi akan membawa manfaat besar. Dalam coding atau tugas lain, Anda bisa beriterasi lebih cepat, terutama saat berkolaborasi dengan sistem. Sistem yang cepat, meskipun tidak paling canggih, misalnya hanya 90-95% dari kemampuan terdepan, sudah cukup, dan kecepatan iterasi yang lebih tinggi akan memberi keuntungan jauh melebihi 10% kemampuan tambahan itu.

Kegunaan lain adalah menjalankan model ini di perangkat edge, bukan hanya untuk efisiensi, tapi juga untuk privasi dan keamanan. Bayangkan berbagai perangkat yang menangani data pribadi, dan robot. Untuk robot di rumah, Anda ingin menjalankan model yang efisien dan kuat secara lokal, hanya mengandalkan cloud untuk tugas tertentu. Audio dan video diproses secara lokal, data tetap di tempat. Saya membayangkan ini akan menjadi kondisi ideal.

Memori dan penalaran

Gary Tan: Kembali ke konteks dan memori. Saat ini, model bersifat stateless. Jika ada kemampuan belajar berkelanjutan, seperti apa pengalaman pengembang? Bagaimana Anda mengarahkan model seperti itu?

Demis Hassabis: Pertanyaan ini sangat menarik. Kurangnya pembelajaran berkelanjutan adalah salah satu hambatan utama bagi agen saat ini untuk menyelesaikan tugas lengkap. Agen saat ini sangat berguna untuk bagian-bagian lokal dari tugas, Anda bisa menggabungkan mereka untuk melakukan hal-hal keren, tapi mereka tidak mampu beradaptasi dengan lingkungan spesifik Anda dengan baik. Inilah mengapa mereka belum bisa benar-benar “dilepaskan dan tidak dipantau”, mereka perlu belajar dari konteks spesifik Anda. Untuk mencapai kecerdasan umum yang benar-benar, masalah ini harus diselesaikan.

Gary Tan: Kemajuan dalam penalaran sampai di mana? Chain of thought model saat ini cukup kuat, tapi masih sering melakukan kesalahan yang seharusnya tidak dilakukan oleh mahasiswa cerdas. Apa yang perlu diubah? Apa yang Anda harapkan dari kemajuan penalaran?

Demis Hassabis: Masih banyak ruang inovasi dalam paradigma berpikir. Apa yang kita lakukan masih cukup kasar dan brutal. Ada banyak arah perbaikan, seperti memonitor proses chain of thought dan melakukan intervensi di tengah proses berpikir. Saya sering merasa, baik sistem kita maupun kompetitor, kadang terlalu banyak berpikir, terjebak dalam siklus.

Saya suka menggunakan Gemini untuk bermain catur sebagai contoh. Semua model dasar terdepan sebenarnya cukup buruk dalam bermain catur, ini menarik.

Melihat jalur pikir mereka sangat berharga, karena catur adalah domain yang sangat dipahami, saya bisa dengan cepat menilai apakah mereka menyimpang, apakah penalaran mereka valid. Yang saya lihat, kadang mereka mempertimbangkan langkah, sadar itu langkah buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya mereka berputar dan tetap melakukan langkah buruk itu. Sistem penalaran yang akurat seharusnya tidak mengalami hal ini.

Perbedaan besar ini masih ada, tapi memperbaikinya mungkin hanya butuh satu atau dua penyesuaian. Itulah mengapa kita melihat fenomena “kecerdasan bergerigi” (jagged intelligence), yang mampu menyelesaikan soal medali emas IMO, tapi jika ditanya dengan cara berbeda, bisa melakukan kesalahan matematika dasar sekolah dasar. Dalam hal introspeksi proses berpikir, sepertinya masih ada yang kurang.

Kemampuan nyata agen

Gary Tan: Agen adalah topik besar. Ada yang bilang ini hype. Saya pribadi rasa kita baru mulai. Penilaian internal di DeepMind tentang kemampuan agen yang sebenarnya, seberapa jauh berbeda dari promosi luar?

Demis Hassabis: Saya setuju, kita baru mulai. Untuk mencapai AGI, Anda harus punya sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Ini sudah jelas bagi kami sejak awal. Agen adalah jalur itu, saya rasa kita baru mulai.

Semua orang sedang mencari cara agar agen lebih baik dalam bekerja sama, kami melakukan banyak eksplorasi pribadi, dan banyak orang di sini pasti juga. Bagaimana membuat agen terintegrasi dalam alur kerja, bukan hanya sebagai pelengkap, tapi benar-benar melakukan hal-hal fundamental. Saat ini kita masih dalam tahap eksperimen. Mungkin baru dua atau tiga bulan terakhir kita mulai menemukan skenario yang sangat berharga. Teknologi ini mungkin sudah cukup matang, bukan lagi main-main, tapi benar-benar memberi nilai tambah pada waktu dan efisiensi Anda.

Sering kali saya melihat orang menjalankan puluhan agen selama puluhan jam, tapi saya belum yakin hasilnya sepadan dengan usaha tersebut.

Kami juga belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak toko aplikasi. Saya sendiri pernah menulis, banyak orang di sini juga pernah membuat demo kecil yang bagus. Saya bisa membuat prototipe “Theme Park” dalam setengah jam, sedangkan dulu saya 17 tahun butuh enam bulan.

Saya merasa, jika Anda menghabiskan satu musim panas penuh, Anda bisa membuat sesuatu yang benar-benar luar biasa. Tapi tetap butuh keahlian dan jiwa manusia, selera, Anda harus memastikan hal-hal ini masuk ke produk yang Anda bangun. Saat ini, belum ada anak muda yang menjual game blockbuster lebih dari sejuta kopi, padahal dengan alat dan usaha saat ini, itu seharusnya mungkin. Jadi, ada yang kurang, mungkin terkait proses, alat, atau keduanya. Saya prediksi dalam 6 sampai 12 bulan ke depan, kita akan melihat hasil seperti itu.

Gary Tan: Seberapa besar kemungkinan semuanya akan otomatis sepenuhnya? Saya rasa tidak langsung otomatis penuh. Kemungkinan besar, orang di sini akan mencapai efisiensi 1000 kali lipat dulu, lalu muncul orang yang menggunakan alat ini untuk membuat aplikasi dan game populer, dan baru kemudian otomatisasi di bagian lain.

Demis Hassabis: Betul, itu yang harus Anda lihat terlebih dahulu.

Gary Tan: Ada juga yang melakukan itu, tapi mereka enggan mengungkapkan seberapa banyak agen membantu.

Demis Hassabis: Mungkin begitu. Tapi saya ingin bahas tentang kreativitas. Saya sering memakai contoh AlphaGo, terutama langkah ke-37 di pertandingan kedua. Bagi saya, saya menunggu momen seperti itu muncul, dan setelah itu saya mulai proyek ilmiah seperti AlphaFold. Kami mulai mengerjakan AlphaFold sehari setelah kembali dari Seoul, itu sekitar sepuluh tahun lalu. Kunjungan saya ke Korea kali ini adalah untuk merayakan ulang tahun ke-10 AlphaGo.

Tapi hanya melakukan langkah ke-37 saja tidak cukup. Itu keren dan berguna, tapi apakah sistem ini bisa menemukan inovasi dalam permainan Go itu sendiri? Jika Anda memberinya deskripsi tingkat tinggi, misalnya “sebuah permainan yang bisa dipelajari dalam lima menit, tapi membutuhkan seumur hidup untuk mahir, secara estetika sangat elegan, satu sore bisa menyelesaikan satu pertandingan,” lalu sistem mengembalikan hasilnya sebagai Go. Sistem saat ini tidak mampu melakukan itu. Kenapa?

Gary Tan: Mungkin ada orang di sini yang bisa melakukannya.

Demis Hassabis: Jika ada yang bisa, jawabannya bukan karena sistem kekurangan, tapi karena cara kita menggunakan sistemnya salah. Mungkin ini jawaban yang benar. Mungkin sistem saat ini sudah punya kemampuan itu, hanya butuh kreator yang sangat jenius untuk mengarahkan, memberi jiwa pada proyek tersebut, dan orang itu harus sangat menyatu dengan alatnya. Jika Anda menghabiskan waktu siang-malam dengan alat ini dan punya kreativitas mendalam, mungkin Anda bisa menciptakan sesuatu yang luar biasa.

Open source dan model multimodal

Gary Tan: Beralih ke open source. Baru-baru ini, peluncuran Gemma memungkinkan model yang sangat kuat bisa dijalankan secara lokal. Bagaimana pandangan Anda? Apakah AI akan menjadi sesuatu yang dikuasai pengguna sendiri, bukan lagi utama di cloud? Ini akan mengubah siapa yang bisa membangun produk dengan model ini?

Demis Hassabis: Kami adalah pendukung kuat open source dan ilmu pengetahuan terbuka. Contohnya, AlphaFold kami rilis secara gratis seluruhnya. Sampai hari ini, karya ilmiah kami tetap dipublikasikan di jurnal top. Untuk Gemma, kami ingin menciptakan model terdepan di kelasnya. Saat ini, Gemma sudah diunduh sekitar 40 juta kali dalam dua setengah minggu sejak peluncuran.

Saya juga percaya pentingnya keberadaan ekosistem open source dengan tumpukan teknologi Barat. Model open source dari Tiongkok sangat bagus dan saat ini memimpin di bidang ini, tapi kami yakin Gemma sangat kompetitif di kelasnya.

Bagi kami, ada masalah sumber daya, tidak ada yang punya kapasitas komputasi berlebih untuk membuat dua model terdepan secara bersamaan. Jadi, keputusan kami saat ini adalah: model edge digunakan untuk Android, kacamata, robot, dan lain-lain, sebaiknya dibuat sebagai model terbuka, karena begitu di-deploy ke perangkat, mereka sudah terekspos, jadi lebih baik dibuka sepenuhnya. Kami menyatukan strategi terbuka secara nano, ini juga masuk akal secara strategis.

Gary Tan: Sebelum tampil, saya tunjukkan sistem AI yang saya buat, saya bisa berinteraksi dengan Gemini lewat suara langsung. Saya agak gugup saat memperlihatkan, tapi ternyata berhasil. Gemini sejak awal memang dibangun sebagai multimodal. Saya sudah coba banyak model, interaksi suara langsung ke model plus kemampuan panggil alat dan pemahaman konteks, saat ini tidak ada model lain yang bisa dibandingkan dengan Gemini.

Demis Hassabis: Betul. Salah satu keunggulan Gemini yang belum cukup dikenal adalah, sejak awal kami membangun dengan pendekatan multimodal. Ini membuat langkah awal lebih sulit dibandingkan hanya teks, tapi kami yakin ini akan memberi manfaat jangka panjang, dan saat ini sudah mulai terwujud.

Misalnya, dalam model dunia, kami membangun Genie di atas Gemini (model lingkungan interaktif generatif dari DeepMind). Di bidang robotik juga sama, Gemini Robotics akan dibangun di atas model multimodal, keunggulan ini akan menjadi keunggulan kompetitif. Kami juga semakin banyak menggunakan Gemini di Waymo (perusahaan mobil otonom Alphabet).

Bayangkan asisten digital yang mengikuti Anda ke dunia nyata, mungkin di ponsel atau kacamata, yang mampu memahami dunia fisik dan lingkungan sekitar. Sistem kami sangat kuat di bidang ini. Kami akan terus berinvestasi di arah ini, dan saya yakin keunggulan kami di bidang ini sangat besar.

Gary Tan: Biaya penalaran semakin cepat turun. Ketika penalaran hampir gratis, apa yang menjadi mungkin? Apakah arah optimisasi tim Anda akan berubah?

Demis Hassabis: Saya tidak yakin penalaran akan benar-benar gratis, karena paradoks Jevons (efisiensi meningkatkan konsumsi total). Saya rasa semua orang akhirnya akan memanfaatkan semua kapasitas komputasi yang tersedia.

Bayangkan ratusan ribu agen bekerja sama, atau sekelompok agen berpikir secara paralel dan mengintegrasikan hasilnya. Kami sedang bereksperimen di berbagai arah ini, semua akan menghabiskan sumber daya penalaran yang tersedia.

Dalam hal energi, jika kita menyelesaikan masalah fusi nuklir terkendali, superkonduktivitas suhu kamar, dan baterai optimal, saya rasa melalui ilmu material kita bisa mendekati nol biaya energi. Tapi, proses manufaktur chip dan fisik lainnya masih punya hambatan, setidaknya selama beberapa dekade ke depan. Jadi, batas kuota penalaran tetap ada, dan kita harus menggunakan sumber daya secara efisien.

Terobosan ilmiah berikutnya

Gary Tan: Untungnya, model kecil semakin pintar. Banyak pendiri di bidang bioteknologi dan biologi di sini. AlphaFold 3 sudah melampaui protein, dan memperluas ke molekul biologis yang lebih luas. Seberapa jauh kita dari memodelkan sistem sel lengkap? Apakah ini level tantangan yang benar-benar berbeda?

Demis Hassabis: Isomorphic Labs sangat maju. AlphaFold hanyalah salah satu bagian dari proses penemuan obat, kami juga melakukan penelitian biokimia terkait, merancang senyawa dengan sifat yang tepat, dan akan ada pengumuman besar dalam waktu dekat.

Tujuan akhir kami adalah menciptakan sel virtual lengkap, sebuah simulasi sel lengkap yang bisa diberi gangguan, outputnya mendekati hasil eksperimen, dan memiliki kegunaan nyata. Anda bisa melewati banyak proses pencarian, menghasilkan data sintetis dalam jumlah besar untuk melatih model lain, dan memprediksi perilaku sel nyata.

Saya perkirakan butuh sekitar sepuluh tahun untuk mencapai sel virtual lengkap. Kami mulai dari inti sel, karena relatif mandiri. Masalah utama adalah, apakah kita bisa memotong bagian yang cukup kompleks, cukup mandiri, dan bisa kita perkirakan input-output-nya secara masuk akal, lalu fokus pada sub-sistem ini. Inti sel dari sudut pandang ini sangat cocok.

Masalah lain adalah data yang kurang. Saya sudah berbicara dengan ilmuwan terkemuka di bidang mikroskop elektron dan pencitraan lainnya. Jika bisa melakukan pencitraan sel hidup tanpa membunuhnya, itu akan revolusioner. Karena itu akan mengubahnya menjadi masalah visual, dan kita tahu cara menyelesaikan masalah visual.

Tapi, sejauh ini, teknologi untuk memvisualisasikan sel hidup secara dinamis dengan resolusi nano tanpa merusaknya belum ada. Gambar diam dengan resolusi tinggi sudah sangat detail, itu sangat menjanjikan, tapi belum cukup untuk langsung menjadi masalah visual.

Jadi, ada dua jalur: satu hardware dan data-driven, satu lagi membangun simulator yang lebih baik untuk mensimulasikan sistem dinamis ini.

Gary Tan: Anda tidak hanya melihat biologi. Material science, penemuan obat, pemodelan iklim, matematika—jika harus diurutkan, bidang mana yang akan mengalami transformasi paling besar dalam lima tahun ke depan?

Demis Hassabis: Setiap bidang sangat menarik, dan ini adalah alasan utama mengapa saya sangat bersemangat dan telah menggeluti AI selama lebih dari 30 tahun. Saya selalu percaya AI akan menjadi alat ilmiah utama untuk mempercepat pemahaman ilmiah, penemuan ilmiah, kedokteran, dan pemahaman kita tentang alam semesta.

Awalnya, kami menyatakan misi dalam dua langkah. Pertama, menyelesaikan kecerdasan, yaitu membangun AGI; kedua, menggunakannya untuk menyelesaikan semua masalah lain. Tapi kemudian kami harus mengubah kata-kata, karena orang bertanya, “Benarkah kalian bermaksud menyelesaikan semua masalah?”

Kami memang bermaksud begitu. Sekarang orang mulai memahami apa artinya. Secara spesifik, saya berbicara tentang menyelesaikan apa yang saya sebut “masalah akar” dalam ilmu pengetahuan, bidang yang jika terpecahkan akan membuka cabang penemuan baru. Contohnya, AlphaFold adalah prototipe dari apa yang ingin kami capai.

Lebih dari tiga juta peneliti di seluruh dunia, hampir semua peneliti biologi saat ini menggunakan AlphaFold. Saya dengar dari eksekutif perusahaan farmasi bahwa hampir semua obat yang ditemukan di masa depan akan melibatkan AlphaFold dalam prosesnya. Kami bangga akan hal ini, dan ini adalah dampak yang ingin kami capai dengan AI. Tapi ini baru permulaan.

Saya tidak bisa memikirkan bidang ilmiah atau rekayasa yang AI tidak bisa bantu. Bidang yang Anda sebutkan, saya rasa masih dalam tahap “AlphaFold moment”, hasilnya sudah sangat menjanjikan, tapi tantangan besar belum teratasi. Dalam dua tahun ke depan, kita akan melihat banyak kemajuan di semua bidang ini, dari material science sampai matematika.

Gary Tan: Rasanya seperti kisah Prometheus, memberi manusia kemampuan baru yang luar biasa.

Demis Hassabis: Betul. Tapi seperti pesan dari cerita Prometheus, kita harus berhati-hati dalam menggunakan kemampuan ini, memperhatikan penggunaannya, dan risiko penyalahgunaan alat yang sama.

Pengalaman Sukses

Gary Tan: Banyak di sini mencoba membangun perusahaan yang menerapkan AI dalam sains. Menurut Anda, apa bedanya startup yang benar-benar mendorong batas terdepan dan yang hanya membungkus model dasar dengan API, lalu mengklaim “AI for Science”?

Demis Hassabis: Kalau saya bayangkan, kalau hari ini saya duduk di posisi kalian, mengikuti program di Y Combinator, apa yang akan saya lakukan. Satu hal penting adalah memprediksi arah teknologi AI, yang sangat sulit. Tapi saya yakin menggabungkan AI dengan bidang teknologi mendalam lain, ada peluang besar. Cross-section ini, entah itu material, kedokteran, atau bidang ilmiah lain yang sangat kompleks, dalam waktu dekat tidak akan ada jalan pintas. Bidang ini tidak akan langsung tergantikan oleh pembaruan model dasar berikutnya. Tapi, jika Anda mencari jalur defensif, ini yang saya rekomendasikan.

Saya pribadi selalu tertarik pada teknologi mendalam. Hal yang benar-benar tahan lama dan berharga tidak mudah didapat. Saya selalu tertarik pada teknologi mendalam. Saat kami mulai sekitar 2010, AI sendiri adalah bidang teknologi mendalam—investor bilang “kita sudah tahu ini tidak akan berhasil”, dan akademisi juga menganggap ini bidang kecil yang gagal di tahun 90-an.

Tapi jika Anda percaya pada ide Anda—mengapa ini berbeda kali ini, apa kombinasi unik dari latar belakang Anda—idealnya Anda adalah ahli di bidang machine learning dan aplikasinya, atau mampu membangun tim pendiri yang seperti itu—maka ada potensi besar dan nilai besar yang bisa diciptakan.

Gary Tan: Informasi ini sangat penting. Setelah satu hal berhasil, tampaknya wajar, tapi sebelumnya semua orang menentangnya.

Demis Hassabis: Tentu, jadi Anda harus melakukan apa yang benar-benar Anda minati. Bagi saya, apapun yang terjadi, saya akan tetap mengerjakan AI. Sejak kecil, saya sudah memutuskan ini adalah hal paling berpengaruh yang bisa saya lakukan. Dan memang terbukti, tapi mungkin juga tidak, mungkin kita terlalu dini, 50 tahun lebih awal.

Dan ini juga hal paling menarik yang bisa saya bayangkan. Bahkan jika hari ini kita masih di garasi kecil dan AI belum selesai, saya tetap akan cari cara untuk terus maju. Mungkin saya akan kembali ke dunia akademik, tapi saya akan terus mencari jalan.

Gary Tan: AlphaFold adalah contoh keberuntungan, mengikuti arah yang benar dan bertaruh tepat. Apa yang membuat bidang ilmiah cocok untuk terobosan seperti AlphaFold? Apakah ada pola tertentu, misalnya fungsi tujuan tertentu?

Demis Hassabis: Saya seharusnya menulis ini suatu saat. Dari pengalaman di AlphaGo dan AlphaFold, saya belajar bahwa teknologi kita paling efektif saat:

Pertama, masalah memiliki ruang pencarian kombinatorial besar, semakin besar semakin baik, sampai tidak ada algoritma brute-force atau khusus yang bisa menyelesaikan. Ruang pencarian langkah di Go dan konformasi protein jauh melebihi jumlah atom di alam semesta. Kedua, kita bisa mendefinisikan fungsi tujuan secara jelas, seperti energi bebas protein yang minimal, atau kemenangan di Go, sehingga sistem bisa melakukan gradient ascent. Ketiga, ada cukup data, atau ada simulator yang bisa menghasilkan data sintetis dalam distribusi besar.

Jika ketiga kondisi ini terpenuhi, metode saat ini bisa berjalan jauh, menemukan “jarum dalam tumpukan jerami”. Penemuan obat juga mengikuti logika yang sama: ada senyawa tertentu yang bisa menyembuhkan penyakit dan tanpa efek samping, selama hukum fisika mengizinkan keberadaannya, satu-satunya masalah adalah bagaimana menemukannya secara efisien dan feasible. AlphaFold membuktikan bahwa sistem ini mampu menemukan jarum di ruang pencarian yang sangat besar.

Gary Tan: Saya ingin naik satu tingkat. Kita berbicara bahwa manusia menggunakan metode ini untuk menciptakan AlphaFold, tapi ada lapisan meta, yaitu manusia menggunakan AI untuk mengeksplorasi ruang hipotesis yang mungkin. Seberapa jauh kita dari AI yang mampu melakukan penalaran ilmiah sejati (bukan sekadar pola data) ?

Demis Hassabis: Saya rasa sangat dekat. Kita sedang mengembangkan sistem umum semacam ini. Ada sistem bernama AI co-scientist, dan algoritma seperti AlphaEvolve, yang bisa melakukan lebih dari Gemini dasar. Semua laboratorium terdepan sedang mengeksplorasi ini.

Tapi sampai saat ini, saya belum melihat penemuan ilmiah besar yang benar-benar dibuat oleh sistem ini. Saya rasa itu akan datang. Mungkin terkait dengan kreativitas, melampaui batas pengetahuan yang ada. Pada tingkat itu, ini bukan lagi sekadar pencocokan pola, karena tidak ada pola yang bisa dicocokkan. Ini juga bukan sekadar extrapolasi, melainkan penalaran analogis (analogical reasoning), dan saya rasa sistem saat ini belum mampu, atau kita belum menggunakannya dengan cara yang benar.

Saya sering mengatakan dalam sains, apakah sistem ini bisa mengusulkan hipotesis yang benar-benar menarik, bukan hanya menguji yang sudah ada. Karena menguji hipotesis sendiri bisa menjadi pencapaian besar, seperti membuktikan conjecture Riemann atau menyelesaikan masalah Millennium Prize tertentu, tapi mungkin kita hanya tinggal beberapa tahun lagi untuk sampai di sana.

Lebih sulit lagi, apakah bisa mengajukan satu set masalah Millennium Prize baru yang dianggap oleh matematikawan top sama mendalam dan layak dipelajari seumur hidup. Saya rasa ini level yang lebih tinggi lagi, dan kita belum tahu caranya. Tapi saya percaya, sistem ini akhirnya bisa, mungkin hanya butuh satu atau dua hal lagi.

Cara kita menguji ini adalah, saya menyebutnya “Tes Einstein”, yaitu apakah Anda bisa melatih sistem menggunakan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil-hasil yang dibuat Einstein tahun 1905, termasuk relativitas khusus. Saya rasa kita harus benar-benar melakukan tes ini, coba berulang kali, dan lihat kapan bisa. Jika bisa, maka sistem ini tidak jauh dari mampu menciptakan sesuatu yang benar-benar baru.

Saran untuk startup

Gary Tan: Pertanyaan terakhir. Banyak orang di sini dengan latar belakang teknologi mendalam ingin melakukan hal sebesar Anda. Anda adalah salah satu organisasi riset AI terbesar. Dari pengalaman Anda di garis depan riset AGI, ada hal apa yang Anda tahu sekarang, tapi berharap Anda tahu saat usia 25 tahun?

Demis Hassabis: Kita sebenarnya sudah membahas sebagian. Anda akan menemukan bahwa mengikuti masalah sulit dan masalah sederhana sebenarnya tidak jauh berbeda, hanya cara menanganinya berbeda. Ada tantangan berbeda di setiap bidang. Tapi hidup ini singkat, dan energi terbatas, jadi lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain. Pilih berdasarkan standar ini.

Selain itu, saya rasa dalam beberapa tahun ke depan, kombinasi lintas bidang akan menjadi lebih umum, dan AI akan memudahkan kolaborasi lintas bidang.

Akhirnya, tergantung pada garis waktu AGI Anda. Saya memperkirakan sekitar tahun 2030. Jika Anda memulai proyek teknologi mendalam hari ini, biasanya itu perjalanan sepuluh tahun. Jadi, Anda harus memasukkan kemungkinan munculnya AGI di tengah jalan ke dalam perencanaan. Apa artinya? Tidak selalu buruk, tapi harus dipertimbangkan. Apakah proyek Anda bisa memanfaatkan AGI? Bagaimana sistem AGI akan berinteraksi dengan proyek Anda?

Kembali ke hubungan antara AlphaFold dan sistem AI umum, saya bisa membayangkan Gemini, Claude, atau sistem umum serupa akan memanggil sistem khusus seperti AlphaFold sebagai alat. Saya tidak percaya kita akan memasukkan semuanya ke dalam satu sistem besar.

Link video asli

Klik untuk mengetahui lebih lanjut tentang Low-Tempo BlockBeats yang sedang merekrut posisi baru

Selamat bergabung dengan komunitas resmi BlockBeats:

Telegram Langganan: https://t.me/theblockbeats

Telegram Grup Diskusi: https://t.me/BlockBeats_App

Akun resmi Twitter: https://twitter.com/BlockBeatsAsia

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
WCTCTradingKingPK
438.74K Popularitas
#
USSeeksStrategicBitcoinReserve
58.68M Popularitas
#
IsraelStrikesIranBTCPlunges
37.19K Popularitas
#
BitcoinETFOptionLimitQuadruples
979.09K Popularitas
#
#FedHoldsRateButDividesDeepen
30.36K Popularitas

Sematkan

peta situs

Wawancara Pendiri DeepMind: Arsitektur AGI, Status Agen, dan Terobosan Ilmiah Sepuluh Tahun Mendatang

Pengantar editor

Kutipan Paling Berkesan

Jalur dan garis waktu AGI

Memori dan jendela konteks

Kekurangan penalaran

Agen dan kreativitas

Distilasi dan model kecil

Penemuan ilmiah dan “Tes Einstein”

Saran untuk startup teknologi mendalam

Jalur Realisasi AGI

Distilasi dan model kecil

Memori dan penalaran

Kemampuan nyata agen

Open source dan model multimodal

Terobosan ilmiah berikutnya

Pengalaman Sukses

Saran untuk startup

Topik Trending

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

Sematkan