CEO Google DeepMind, pemenang Nobel Kimia Demis Hassabis, mengunjungi Y Combinator, membahas kemajuan kunci menuju AGI, memberi saran kepada pengusaha tentang bagaimana tetap unggul, serta di mana kemungkinan munculnya terobosan ilmiah besar berikutnya.

Judgment paling praktis bagi pengusaha teknologi mendalam adalah, jika Anda memulai proyek teknologi mendalam jangka sepuluh tahun hari ini, Anda harus memasukkan munculnya AGI ke dalam perencanaan. Selain itu, dia juga mengungkapkan bahwa Isomorphic Labs (perusahaan farmasi AI yang dipisahkan dari DeepMind) akan mengumumkan berita besar dalam waktu dekat.

Kutipan Paling Berkesan

Rencana dan garis waktu AGI

·「Komponen teknologi yang ada saat ini hampir pasti akan menjadi bagian dari arsitektur akhir AGI.」

·「Pembelajaran berkelanjutan, penalaran jangka panjang, dan beberapa aspek memori masih belum terselesaikan, AGI harus mengatasi semuanya.」

·「Jika garis waktu AGI Anda sekitar 2030 seperti saya, dan Anda memulai proyek teknologi mendalam hari ini, Anda harus mempertimbangkan bahwa AGI akan muncul di tengah jalan.」

Memori dan jendela konteks

·「Jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Tapi masalahnya, kita memasukkan semua hal ke dalamnya, termasuk informasi yang tidak penting dan salah, dan saat ini cara ini cukup kasar.」

·「Jika harus memproses aliran video real-time dan menyimpan semua token, satu juta token sebenarnya cukup untuk sekitar 20 menit.」

Kekurangan penalaran

·「Saya suka bermain catur dengan Gemini. Kadang-kadang dia sadar ini langkah buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya dia jalanin juga. Tapi sistem penalaran yang akurat seharusnya tidak seperti ini.」

·「Di satu sisi dia bisa menyelesaikan soal setingkat medali emas IMO, di sisi lain, jika ditanya dengan cara berbeda, dia bisa melakukan kesalahan matematika dasar. Dalam introspeksi proses berpikirnya, sepertinya masih ada yang kurang.」

Agent dan kreativitas

·「Untuk mencapai AGI, Anda harus memiliki sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Agent adalah jalur itu, saya rasa kita baru mulai.」

·「Saya belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak peringkat toko aplikasi. Dengan usaha saat ini, itu seharusnya mungkin, tapi belum terjadi. Ini menunjukkan alat atau prosesnya masih kurang.」

Distilasi dan model kecil

·「Asumsi kami adalah, setelah model Pro terbaru dirilis selama setengah tahun hingga satu tahun, kemampuannya bisa dikompresi ke model yang sangat kecil dan bisa dijalankan di perangkat edge. Sampai sekarang, kami belum menemui batas densitas informasi secara teoretis.」

Penemuan ilmiah dan "Tes Einstein"

·「Kadang-kadang saya menyebutnya 'Tes Einstein', yaitu apakah bisa melatih sistem dengan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil yang dibuat Einstein pada 1905, termasuk relativitas khusus. Jika bisa, sistem ini tidak jauh dari penemuan sesuatu yang benar-benar baru.」

·「Menyelesaikan satu masalah hadiah Millennium Prize sudah luar biasa, tapi yang lebih sulit adalah mengajukan satu set masalah Millennium Prize baru yang dianggap sama mendalam dan layak diteliti seumur hidup oleh matematikawan top.」

Saran untuk startup teknologi mendalam

·「Mengikuti masalah sulit dan masalah sederhana sebenarnya hampir sama, hanya caranya berbeda. Hidup ini singkat, lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain.」

Jalur Realisasi AGI

Gary Tan: Anda telah memikirkan AGI hampir lebih lama dari orang lain. Melihat paradigma saat ini, menurut Anda, berapa banyak arsitektur akhir AGI yang sudah kita miliki? Apa yang secara fundamental masih hilang?

Demis Hassabis: Pretraining skala besar, RLHF, chain of thought, saya yakin semuanya akan menjadi bagian dari arsitektur akhir AGI. Teknologi ini sudah membuktikan banyak hal. Saya sulit membayangkan dalam dua tahun ke depan kita akan menemukan jalan buntu, itu tidak masuk akal bagi saya. Tapi di atas apa yang sudah ada, mungkin masih kurang satu atau dua hal. Continual learning, reasoning jangka panjang, dan beberapa aspek memori masih punya masalah yang belum terselesaikan.

AGI harus semua diselesaikan. Mungkin teknologi yang ada ditambah inovasi bertahap bisa mencapai tingkat itu, tapi juga bisa tinggal satu atau dua titik kunci besar yang perlu ditembus. Saya rasa tidak lebih dari satu atau dua. Penilaian pribadi saya, peluang ada masalah besar yang belum terpecahkan itu sekitar 50:50. Jadi di Google DeepMind, kami sedang mengembangkan kedua jalur tersebut.

Gary Tan: Saya berinteraksi dengan banyak sistem Agent, yang paling mengejutkan saya adalah, dasar-dasarnya selalu sama, berulang-ulang. Jadi konsep pembelajaran berkelanjutan sangat menarik, karena saat ini kita sebenarnya sedang menambal dengan pita, seperti yang dilakukan dalam siklus "dreaming" di malam hari.

Demis Hassabis: Betul, siklus mimpi itu keren. Kami pernah memikirkan ini dalam integrasi memori situasional. Saya meneliti bagaimana hippocampus secara elegan mengintegrasikan pengetahuan baru ke dalam sistem pengetahuan yang sudah ada. Otak sangat hebat dalam hal ini.

Proses ini dilakukan saat tidur, terutama selama REM sleep, dengan memutar ulang pengalaman penting untuk belajar. Program Atari awal kami, DQN (DeepMind 2013, deep Q-network yang pertama kali menggunakan deep reinforcement learning untuk mencapai level manusia di game Atari), mampu menguasai game Atari berkat pengalaman replay.

Ini belajar dari neuroscience, memutar ulang jalur sukses berulang kali. Itu sudah sejak 2013, di bidang AI termasuk kuno, tapi sangat penting saat itu.

Saya setuju dengan Anda, saat ini kita memang sedang menambal dengan pita. Memasukkan semua ke dalam jendela konteks. Rasanya tidak benar. Secara teori, kita bisa punya jendela konteks jutaan atau puluhan juta token, dan memori yang sempurna, tapi biaya pencarian dan retrieval tetap ada. Dalam pengambilan keputusan saat ini, menemukan informasi yang benar-benar relevan tidak mudah, meskipun semua data disimpan. Jadi saya rasa bidang memori masih punya ruang inovasi besar.

Gary Tan: Jujur saja, jendela konteks satu juta token sudah jauh lebih besar dari yang saya bayangkan, dan bisa melakukan banyak hal.

Demis Hassabis: Untuk sebagian besar skenario penggunaannya, itu sudah cukup besar. Tapi bayangkan, jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Masalahnya, kita memasukkan semua, termasuk yang tidak penting dan salah, dan cara ini cukup kasar. Kalau harus memproses streaming video real-time dan menyimpan semua token, satu juta token hanya cukup untuk sekitar 20 menit. Tapi jika ingin sistem memahami kehidupan Anda selama satu atau dua bulan, itu jauh dari cukup.

Gary Tan: DeepMind selalu sangat fokus pada reinforcement learning dan pencarian, filosofi ini sangat tertanam dalam pembangunan Gemini. Seberapa dalam Anda mengintegrasikan filosofi ini ke dalam proses? Apakah reinforcement learning masih diremehkan?

Demis Hassabis: Mungkin memang masih diremehkan. Perhatian terhadapnya naik turun. Sejak hari pertama di DeepMind, kami sudah mengerjakan sistem Agent. Semua pekerjaan di Atari dan AlphaGo, pada dasarnya adalah reinforcement learning Agent, sistem yang mampu mencapai tujuan, membuat keputusan, dan merencanakan secara mandiri. Tentu saja, waktu itu kami memilih bidang game karena kompleksitasnya bisa dikendalikan, lalu secara bertahap mengerjakan game yang lebih kompleks, seperti AlphaGo, kemudian AlphaStar. Intinya, kami sudah melakukan semua game yang memungkinkan.

Pertanyaan berikutnya adalah, apakah model-model ini bisa digeneralisasi menjadi model dunia atau model bahasa, bukan hanya model game. Dalam beberapa tahun terakhir, kami sudah mengerjakan ini. Saat ini, semua model terdepan dan chain of thought mereka sebenarnya adalah pengulangan dari apa yang AlphaGo mulai lakukan dulu.

Saya rasa banyak pekerjaan yang kami lakukan dulu sangat relevan dengan apa yang kita lakukan sekarang, kita sedang meninjau kembali ide-ide lama, dengan skala lebih besar dan lebih umum, termasuk Monte Carlo tree search dan berbagai metode reinforcement learning lainnya. Ide-ide dari AlphaGo dan AlphaZero sangat terkait dengan model dasar saat ini, dan saya yakin banyak kemajuan dalam beberapa tahun ke depan akan berasal dari sini.

Distilasi dan model kecil

Gary Tan: Sekarang, untuk menjadi lebih pintar, kita membutuhkan model yang lebih besar, tapi di sisi lain, distilasi juga berkembang, sehingga model kecil bisa sangat cepat. Model Flash kalian sangat kuat, mampu mencapai sekitar 95% dari performa model terdepan, tapi harganya hanya sepersepuluh. Benar begitu?

Demis Hassabis: Saya rasa ini salah satu keunggulan utama kami. Anda harus membangun model terbesar dulu untuk mendapatkan kemampuan terdepan. Salah satu keunggulan kami adalah mampu dengan cepat mendistilasi dan mengompresi kemampuan tersebut ke model yang lebih kecil. Metode distilasi ini sebenarnya kami yang menciptakan, dan kami masih menjadi yang terdepan di dunia. Selain itu, kami punya motivasi bisnis yang kuat untuk melakukan ini. Kami mungkin adalah platform AI aplikasi terbesar di dunia.

Dengan AI Overviews dan AI Mode, serta Gemini, sekarang setiap produk Google, termasuk Maps dan YouTube, mengintegrasikan Gemini atau teknologi terkait. Ini menyentuh miliaran pengguna dan puluhan produk dengan miliaran pengguna. Mereka harus sangat cepat, efisien, biaya rendah, dan latensi rendah. Ini memberi kami motivasi besar untuk mengoptimalkan Flash dan model Flash-Lite yang lebih kecil agar sangat efisien, dan saya berharap ini akhirnya bisa melayani berbagai kebutuhan pengguna.

Gary Tan: Saya penasaran, seberapa pintar model-model kecil ini sebenarnya. Apakah distilasi punya batas? Apakah model 50B atau 400B bisa secerdas model terdepan saat ini?

Demis Hassabis: Saya rasa kita belum mencapai batas teori informasi, setidaknya saat ini tidak ada yang tahu. Mungkin suatu hari akan ada batas densitas informasi, tapi saat ini asumsi kami adalah, setelah model Pro terbaru dirilis selama setengah tahun sampai satu tahun, kemampuannya bisa dikompresi ke model yang sangat kecil dan bisa dijalankan di perangkat edge.

Kita juga bisa melihat ini di model Gemma, model Gemma 4 kami menunjukkan performa sangat kuat dengan ukuran yang sama. Ini berkat banyak teknik distilasi dan optimisasi efisiensi model kecil. Jadi saya benar-benar tidak melihat batas teori, dan saya rasa kita masih jauh dari batas itu.

Gary Tan: Sekarang, ada fenomena yang cukup gila, yaitu bahwa jumlah pekerjaan yang bisa dilakukan insinyur meningkat sekitar 500 sampai 1000 kali dibandingkan enam bulan lalu. Ada orang di ruangan ini yang melakukan pekerjaan setara dengan insinyur Google tahun 2000-an, 1000 kali lipat. Steve Yegge pernah membahas ini.

Demis Hassabis: Saya merasa sangat antusias. Model kecil punya banyak kegunaan. Salah satunya biaya rendah dan kecepatan tinggi, yang juga membawa manfaat. Dalam coding atau tugas lain, Anda bisa beriterasi lebih cepat, terutama saat berkolaborasi dengan sistem. Sistem yang cepat, meskipun tidak paling canggih, misalnya hanya 90-95% dari kemampuan terdepan, sudah cukup, dan kecepatan iterasi yang lebih tinggi akan memberi manfaat jauh melebihi 10% kemampuan tambahan itu.

Selain itu, ada tren besar untuk menjalankan model-model ini di perangkat edge, bukan hanya demi efisiensi, tapi juga untuk privasi dan keamanan. Bayangkan berbagai perangkat yang menangani data pribadi sangat sensitif, dan robot. Untuk robot di rumah, Anda ingin menjalankan model yang efisien dan kuat secara lokal, hanya mengandalkan cloud untuk tugas tertentu. Audio dan video diproses secara lokal, data tetap di perangkat, saya bayangkan ini akan menjadi kondisi ideal.

Memori dan penalaran

Gary Tan: Kembali ke konteks dan memori. Saat ini, model bersifat stateless. Jika ada kemampuan belajar berkelanjutan, seperti apa pengalaman pengembang? Bagaimana Anda mengarahkan model seperti ini?

Demis Hassabis: Pertanyaan ini sangat menarik. Kurangnya pembelajaran berkelanjutan adalah salah satu hambatan utama bagi Agent saat ini untuk menyelesaikan tugas lengkap. Agent saat ini sangat berguna untuk bagian-bagian lokal dari tugas, Anda bisa menggabungkan mereka untuk melakukan hal-hal keren, tapi mereka tidak mampu beradaptasi dengan lingkungan spesifik Anda dengan baik. Inilah sebabnya mereka belum bisa benar-benar "dilepaskan dan tidak dipantau". Mereka perlu mampu belajar dari konteks spesifik Anda. Untuk mencapai kecerdasan umum yang benar-benar, masalah ini harus terselesaikan.

Gary Tan: Bagaimana perkembangan penalaran? Saat ini, chain of thought mereka cukup kuat, tapi mereka masih melakukan kesalahan yang seharusnya tidak dilakukan oleh mahasiswa cerdas. Apa yang perlu diubah? Apa yang Anda harapkan dari kemajuan penalaran?

Demis Hassabis: Masih banyak ruang inovasi dalam paradigma berpikir. Apa yang kita lakukan masih cukup kasar dan brutal. Ada banyak arah perbaikan, seperti memonitor proses chain of thought dan melakukan intervensi di tengah proses berpikir. Saya sering merasa, baik sistem kita maupun kompetitor, kadang terlalu banyak berpikir, terjebak dalam siklus.

Saya suka menggunakan Gemini untuk bermain catur sebagai contoh. Semua model dasar terdepan sebenarnya cukup buruk dalam bermain catur, ini menarik.

Melihat jalur pikir mereka sangat berharga, karena catur adalah domain yang sangat dipahami, saya bisa dengan cepat menilai apakah mereka menyimpang, apakah penalarannya valid. Kita sering melihat mereka mempertimbangkan langkah, sadar ini langkah buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya jalanin juga. Sistem penalaran yang akurat seharusnya tidak seperti ini.

Perbedaan besar ini masih ada, tapi memperbaikinya mungkin hanya butuh satu atau dua penyesuaian. Itulah mengapa kita melihat fenomena "kecerdasan bergerigi" (jagged intelligence), yang mampu menyelesaikan soal medali emas IMO, tapi jika ditanya dengan cara berbeda, bisa melakukan kesalahan matematika dasar. Dalam introspeksi proses berpikirnya, sepertinya masih ada yang kurang.

Kemampuan Agent yang sebenarnya

Gary Tan: Agent adalah topik besar. Ada yang bilang ini hype. Saya pribadi rasa kita baru mulai. Penilaian internal di DeepMind tentang kemampuan Agent sebenarnya seperti apa, dan seberapa besar gap dengan promosi eksternal?

Demis Hassabis: Saya setuju, kita baru mulai. Untuk mencapai AGI, Anda harus punya sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Ini sudah sangat jelas bagi kami. Agent adalah jalur itu, saya rasa kita baru mulai.

Semua orang sedang bereksperimen bagaimana membuat Agent lebih baik dalam bekerja sama, banyak yang sudah dilakukan dalam eksperimen pribadi, dan mungkin Anda juga. Bagaimana membuat Agent terintegrasi dalam alur kerja, bukan sekadar pelengkap, tapi benar-benar melakukan hal-hal fundamental. Saat ini kita masih dalam tahap eksperimen. Baru dalam dua atau tiga bulan terakhir kita mulai menemukan skenario yang sangat berharga. Teknologi ini mungkin sudah cukup matang, bukan lagi main-main, tapi benar-benar bisa meningkatkan waktu dan efisiensi Anda.

Sering saya lihat orang menjalankan puluhan Agent selama puluhan jam, tapi saya belum yakin hasilnya sepadan dengan usaha tersebut.

Kami juga belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak toko aplikasi. Saya sendiri pernah membuat prototipe, banyak yang lain juga. Sekarang, saya bisa membuat prototipe "Theme Park" dalam setengah jam, sedangkan dulu saya butuh enam bulan saat umur 17 tahun.

Saya merasa, jika Anda menghabiskan satu musim panas penuh, Anda bisa membuat sesuatu yang benar-benar luar biasa. Tapi tetap butuh keahlian dan jiwa manusia, selera, Anda harus memastikan hal-hal ini masuk ke produk yang Anda bangun. Saat ini, belum ada anak muda yang menjual game blockbuster dengan lebih dari sepuluh juta kopi, padahal dengan alat dan usaha saat ini, itu seharusnya bisa. Jadi, ada yang kurang, mungkin terkait proses, mungkin alat. Saya prediksi dalam 6 sampai 12 bulan ke depan, kita akan melihat hasil seperti itu.

Gary Tan: Sejauh mana ini akan otomatis sepenuhnya? Saya rasa tidak akan langsung otomatis penuh. Kemungkinan besar, orang akan mencapai efisiensi 1000 kali lipat dulu, lalu muncul orang yang menggunakan alat ini untuk membuat aplikasi dan game populer, dan baru kemudian otomatisasi di bagian lain.

Demis Hassabis: Betul, itu yang harus Anda lihat dulu.

Gary Tan: Ada juga yang melakukan itu, tapi mereka enggan mengungkapkan seberapa banyak Agent membantu.

Demis Hassabis: Mungkin. Tapi saya ingin bahas tentang kreativitas. Saya sering memakai contoh AlphaGo, terutama langkah ke-37 di pertandingan kedua. Bagi saya, saya menunggu momen seperti itu muncul, dan setelah itu saya mulai proyek ilmiah seperti AlphaFold. Kami mulai mengerjakan AlphaFold sehari setelah kembali dari Seoul, itu sekitar sepuluh tahun lalu. Kunjungan saya ke Korea kali ini untuk merayakan ulang tahun ke-10 AlphaGo.

Tapi hanya satu langkah Move 37 saja tidak cukup. Itu keren dan berguna, tapi apakah sistem ini bisa menemukan inovasi dalam permainan Go itu sendiri? Jika Anda memberinya deskripsi tingkat tinggi, misalnya "sebuah permainan yang bisa dipelajari dalam lima menit, tapi sulit dikuasai seumur hidup, estetis dan elegan, bisa selesai dalam satu sore," lalu sistem mengembalikan hasil berupa Go, itu belum bisa dilakukan sistem saat ini. Kenapa?

Gary Tan: Mungkin ada orang di sini yang bisa melakukannya.

Demis Hassabis: Kalau ada yang bisa, jawabannya bukan karena sistem kekurangan sesuatu, tapi karena cara kita menggunakan sistemnya salah. Mungkin memang begitulah jawabannya. Mungkin sistem saat ini sudah punya kemampuan itu, hanya butuh kreator yang sangat jenius untuk mengarahkan, memberi jiwa pada proyek tersebut, dan orang itu harus sangat menyatu dengan alatnya. Kalau Anda menghabiskan waktu siang malam dengan alat-alat ini dan punya kreativitas mendalam, mungkin Anda bisa menciptakan sesuatu yang luar biasa.

Open source dan model multimodal

Gary Tan: Beralih ke open source. Baru-baru ini, peluncuran Gemma memungkinkan model yang sangat kuat dijalankan secara lokal. Bagaimana pandangan Anda? Apakah AI akan menjadi sesuatu yang dikuasai pengguna sendiri, bukan lagi di cloud utama? Ini akan mengubah siapa yang bisa membangun produk dengan model-model ini?

Demis Hassabis: Kami adalah pendukung kuat open source dan ilmu pengetahuan terbuka. Contohnya, AlphaFold kami buka secara gratis. Sampai saat ini, karya ilmiah kami tetap dipublikasikan di jurnal top. Untuk Gemma, kami ingin menciptakan model terdepan di kelasnya. Saat ini, Gemma sudah diunduh sekitar 40 juta kali dalam dua setengah minggu sejak peluncuran.

Saya juga percaya pentingnya keberadaan ekosistem open source dari teknologi Barat. Model open source dari China sangat bagus dan saat ini memimpin, tapi kami yakin Gemma sangat kompetitif di kelasnya.

Kami menghadapi kendala sumber daya, tidak ada yang punya kapasitas komputasi berlebih untuk membuat dua model terdepan sekaligus. Jadi, keputusan kami saat ini adalah: model edge untuk Android, kacamata, robot, dan lain-lain, sebaiknya dibuat terbuka, karena begitu di-deploy ke perangkat, mereka sudah terekspos, jadi lebih baik dibuka sepenuhnya. Kami menyatukan strategi terbuka secara nano, ini juga masuk akal secara strategis.

Gary Tan: Sebelum tampil, saya tunjukkan sistem AI yang saya buat, saya bisa berinteraksi dengan Gemini lewat suara. Saya agak gugup saat memperlihatkan, tapi ternyata berhasil. Gemini sejak awal memang dibangun multimodal. Saya sudah coba banyak model, interaksi suara langsung ke model plus kemampuan panggil alat dan pemahaman konteks, saat ini tidak ada yang bisa menandingi Gemini.

Demis Hassabis: Betul. Salah satu keunggulan Gemini yang belum cukup dikenal adalah, sejak awal kami membangun dengan pendekatan multimodal. Ini membuat langkah awal lebih sulit dibandingkan hanya teks, tapi kami yakin ini akan memberi manfaat jangka panjang, dan saat ini sudah mulai terwujud.

Misalnya dalam model dunia, kami membangun Genie di atas Gemini (lingkungan interaktif generatif dari DeepMind). Di bidang robotik, Gemini Robotics akan dibangun di atas model multimodal, dan keunggulan kami di multimodal akan menjadi benteng kompetitif. Kami juga semakin banyak menggunakan Gemini di Waymo (perusahaan mobil otonom Alphabet).

Bayangkan asisten digital yang mengikuti Anda ke dunia nyata, mungkin di ponsel atau kacamata, yang mampu memahami dunia fisik dan lingkungan sekitar. Sistem kami sangat kuat di bidang ini. Kami akan terus berinvestasi di bidang ini, dan saya yakin keunggulan kami di bidang ini sangat besar.

Gary Tan: Biaya penalaran semakin cepat turun. Ketika penalaran hampir gratis, apa yang menjadi mungkin? Apakah fokus tim Anda akan berubah?

Demis Hassabis: Saya tidak yakin penalaran akan benar-benar gratis, karena paradoks Jevons (efisiensi meningkatkan konsumsi total). Saya rasa semua orang akhirnya akan memanfaatkan seluruh kapasitas komputasi yang tersedia.

Bayangkan ratusan ribu Agent bekerja sama, atau sekelompok Agent yang berpikir secara paralel dan mengintegrasikan hasilnya. Kami sedang bereksperimen dengan semua ini, dan semua akan menghabiskan sumber daya penalaran yang tersedia.

Dari segi energi, jika kita menyelesaikan masalah fusi nuklir yang terkendali, superkonduktivitas suhu kamar, dan baterai optimal, saya yakin kita bisa capai melalui ilmu material, sehingga biaya energi mendekati nol. Tapi, proses manufaktur chip dan fisik lainnya masih punya hambatan, setidaknya selama beberapa dekade ke depan. Jadi, batas kuota penalaran tetap ada, dan kita harus menggunakannya secara efisien.

Terobosan ilmiah berikutnya

Gary Tan: Untungnya, model kecil semakin pintar. Banyak pendiri di bidang bioteknologi dan biologi di sini. AlphaFold 3 sudah melampaui protein, dan sekarang memperluas ke molekul biologis yang lebih umum. Seberapa jauh kita dari memodelkan sistem sel lengkap? Apakah ini level tantangan yang benar-benar berbeda?

Demis Hassabis: Isomorphic Labs sangat maju. AlphaFold hanyalah salah satu bagian dari proses penemuan obat. Kami juga mengerjakan penelitian biokimia terkait, seperti desain senyawa dengan sifat tertentu, dan akan ada pengumuman besar dalam waktu dekat.

Tujuan akhir kami adalah menciptakan simulasi sel virtual lengkap, sebuah model sel lengkap yang bisa diintervensi, outputnya mendekati hasil eksperimen, dan memiliki kegunaan nyata. Anda bisa melewati banyak proses pencarian, menghasilkan data sintetis besar untuk melatih model lain, dan memprediksi perilaku sel nyata.

Saya perkirakan butuh sekitar sepuluh tahun untuk mencapai sel virtual lengkap. Kami mulai dari inti sel, karena relatif mandiri. Masalah utama adalah, apakah kita bisa memotong bagian kompleks yang cukup mandiri, yang input dan outputnya bisa diperkirakan secara wajar, lalu fokus ke sub-sistem ini. Inti sel dari sudut pandang ini sangat cocok.

Masalah lain adalah data yang terbatas. Saya sudah berbicara dengan ilmuwan mikroskop elektron dan teknik pencitraan lainnya. Jika bisa melakukan pencitraan sel hidup tanpa membunuhnya, itu akan revolusioner. Karena itu akan mengubahnya menjadi masalah visual, dan kita tahu cara menyelesaikan masalah visual.

Tapi, sejauh ini, teknologi untuk memotret sel hidup secara dinamis dengan resolusi nano dan tanpa merusak masih belum ada. Gambar diam dengan resolusi tinggi sudah sangat canggih, tapi belum cukup untuk langsung menjadi masalah visual.

Jadi, ada dua jalur: hardware dan data-driven, dan membangun simulator yang lebih baik untuk mensimulasikan dinamika ini.

Gary Tan: Anda tidak hanya melihat biologi. Dalam material science, penemuan obat, pemodelan iklim, matematika, jika harus diurutkan, bidang mana yang akan mengalami transformasi paling besar dalam lima tahun ke depan?

Demis Hassabis: Setiap bidang sangat menarik, dan ini adalah alasan utama mengapa saya sangat bersemangat dan telah berkecimpung di AI selama lebih dari 30 tahun. Saya selalu percaya AI akan menjadi alat ilmiah utama untuk mempercepat pemahaman ilmiah, penemuan ilmiah, kedokteran, dan pemahaman kita tentang alam semesta.

Awalnya, kami menyatakan misi dalam dua langkah. Pertama, menyelesaikan kecerdasan, yaitu membangun AGI; kedua, menggunakan itu untuk menyelesaikan semua masalah lain. Tapi kemudian kami harus mengubah kata-kata, karena orang bertanya, "Benarkah kalian bermaksud menyelesaikan semua masalah?"

Kami memang bermaksud begitu. Sekarang orang mulai memahami apa artinya. Secara spesifik, saya berbicara tentang menyelesaikan "masalah akar" dalam bidang ilmiah, yang jika terpecahkan, akan membuka cabang penemuan baru. Contohnya, AlphaFold adalah prototipe dari apa yang ingin kami capai.

Lebih dari tiga juta peneliti di seluruh dunia, hampir semua peneliti biologi saat ini menggunakan AlphaFold. Saya dengar dari eksekutif perusahaan farmasi bahwa hampir semua obat yang ditemukan di masa depan akan melibatkan AlphaFold dalam prosesnya. Kami bangga akan hal ini, dan ini adalah dampak yang ingin kami capai dengan AI. Tapi ini baru permulaan.

Saya tidak bisa memikirkan bidang ilmiah atau rekayasa yang AI tidak bisa bantu. Bidang-bidang yang Anda sebutkan, saya rasa masih dalam fase "AlphaFold 1", hasilnya sudah sangat menjanjikan, tapi tantangan besar belum terpecahkan. Dalam dua tahun ke depan, kita akan melihat banyak kemajuan di semua bidang ini, dari material science sampai matematika.

Gary Tan: Rasanya seperti kisah Prometheus, memberi manusia kemampuan baru yang luar biasa.

Demis Hassabis: Betul. Tapi seperti cerita Prometheus, kita harus berhati-hati dengan bagaimana kemampuan ini digunakan, di mana dipakai, dan risiko penyalahgunaannya.

Pengalaman Sukses

Gary Tan: Banyak di sini mencoba membangun perusahaan yang menerapkan AI dalam sains. Menurut Anda, apa bedanya startup yang benar-benar mendorong batas terdepan dan yang hanya membungkus model dasar dengan API, lalu mengklaim "AI for Science"?

Demis Hassabis: Kalau saya bayangkan, kalau saya duduk di posisi kalian, menonton proyek di Y Combinator, apa yang akan saya lakukan? Satu hal penting adalah memprediksi arah teknologi AI, yang sangat sulit. Tapi saya yakin menggabungkan AI dengan bidang teknologi mendalam lain punya peluang besar. Cross-disciplinary ini, entah itu material, kedokteran, atau bidang ilmiah lain yang sangat kompleks, dalam waktu dekat tidak akan ada jalan pintas. Bidang ini tidak akan langsung tergilas oleh pembaruan model dasar berikutnya. Kalau mau cari jalur defensif, ini yang saya rekomendasikan.

Saya pribadi selalu tertarik pada teknologi mendalam. Hal yang benar-benar tahan lama dan berharga tidak mudah didapat. Saya selalu tertarik pada teknologi mendalam. Saat kami mulai sekitar 2010, AI sendiri adalah bidang teknologi mendalam—investor bilang "kita sudah tahu ini tidak akan berhasil", dan akademisi juga menganggap ini bidang kecil yang gagal di tahun 90-an.

Tapi jika Anda percaya pada ide Anda—mengapa ini berbeda kali ini, apa kombinasi unik latar belakang Anda—idealnya Anda adalah ahli di bidang machine learning dan aplikasinya, atau mampu membentuk tim pendiri yang seperti itu—maka ada potensi besar dan nilai besar yang bisa diciptakan.

Gary Tan: Informasi ini sangat penting. Setelah satu hal berhasil, tampak wajar, tapi sebelumnya semua orang menentang.

Demis Hassabis: Tentu, jadi Anda harus melakukan apa yang benar-benar Anda minati. Bagi saya, apapun yang terjadi, saya akan tetap mengerjakan AI. Sejak kecil, saya sudah memutuskan ini adalah hal paling berpengaruh yang bisa saya lakukan. Dan memang terbukti, tapi mungkin juga tidak, mungkin kita terlalu dini, 50 tahun lebih awal.

Dan ini juga hal paling menarik yang bisa saya pikirkan. Bahkan jika hari ini kita masih di garasi kecil dan AI belum jadi, saya tetap akan cari cara untuk terus maju. Mungkin saya kembali ke dunia akademik, tapi saya akan terus berusaha.

Gary Tan: AlphaFold adalah contoh keberuntungan, mengikuti arah yang tepat dan bertaruh benar. Apa yang membuat bidang ilmiah cocok untuk terobosan seperti AlphaFold? Apakah ada pola tertentu, misalnya fungsi objektif tertentu?

Demis Hassabis: Saya seharusnya menulis ini suatu saat. Dari pengalaman di AlphaGo dan AlphaFold, saya belajar bahwa teknologi kita paling efektif saat:

Pertama, masalah memiliki ruang pencarian kombinatorial yang besar, semakin besar semakin baik, sampai tidak bisa diselesaikan dengan brute force atau algoritma khusus. Ruang pencarian Go dan konfigurasi protein jauh melebihi jumlah atom di alam semesta. Kedua, kita bisa mendefinisikan fungsi objektif yang jelas, seperti energi bebas protein, atau kemenangan dalam permainan Go, sehingga sistem bisa melakukan gradient ascent. Ketiga, ada cukup data, atau ada simulator yang bisa menghasilkan data sintetis dalam distribusi besar.

Jika ketiga kondisi ini terpenuhi, metode saat ini bisa berjalan jauh, menemukan "jarum dalam tumpukan jerami". Penemuan obat juga mengikuti logika yang sama: ada senyawa tertentu yang bisa menyembuhkan penyakit dan tidak memiliki efek samping, selama hukum fisika memungkinkan keberadaannya, satu-satunya masalah adalah bagaimana menemukannya secara efisien dan feasible. AlphaFold membuktikan bahwa sistem ini mampu menemukan jarum di ruang pencarian yang sangat besar.

Gary Tan: Saya ingin naik satu level. Kita berbicara tentang manusia yang menggunakan metode ini untuk menciptakan AlphaFold, tapi ada juga level meta, yaitu manusia menggunakan AI untuk mengeksplorasi ruang hipotesis yang mungkin. Seberapa jauh kita dari AI yang mampu melakukan penalaran ilmiah sejati (bukan sekadar pola data) ?

Demis Hassabis: Saya rasa sangat dekat. Kita sedang mengembangkan sistem umum seperti itu. Ada sistem bernama AI co-scientist, dan algoritma seperti AlphaEvolve yang bisa melakukan lebih dari Gemini dasar. Semua laboratorium terdepan sedang mengeksplorasi ini.

Tapi sampai saat ini, saya belum melihat penemuan ilmiah besar yang benar-benar dibuat oleh sistem ini. Saya rasa itu akan datang. Mungkin terkait dengan kreativitas, terobosan yang benar-benar melampaui batas pengetahuan. Pada level itu, bukan lagi sekadar pola, karena tidak ada pola yang bisa cocok. Ini lebih ke penalaran analogis, dan saya rasa sistem saat ini belum mampu, atau kita belum menggunakannya dengan cara yang benar.

Saya sering mengatakan dalam sains, apakah sistem ini bisa mengusulkan hipotesis yang benar-benar menarik, bukan sekadar menguji yang sudah ada. Karena menguji hipotesis sendiri bisa jadi pencapaian besar, seperti membuktikan conjecture Riemann atau menyelesaikan masalah Millennium. Tapi mungkin kita hanya tinggal beberapa tahun lagi untuk sampai ke sana.

Lebih sulit lagi, apakah bisa mengajukan satu set masalah Millennium baru yang dianggap sama mendalam dan layak diteliti seumur hidup oleh matematikawan top? Saya rasa ini level yang lebih tinggi lagi, dan kita belum tahu caranya. Tapi saya percaya, sistem ini akhirnya bisa, mungkin tinggal satu atau dua hal lagi yang kurang.

Cara mengujinya adalah, saya sering menyebutnya "Tes Einstein", yaitu apakah Anda bisa melatih sistem dengan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil-hasil Einstein tahun 1905, termasuk relativitas khusus. Saya rasa kita harus benar-benar melakukan tes ini, coba berulang-ulang, dan lihat kapan bisa. Kalau sudah bisa, sistem ini tidak jauh dari penemuan sesuatu yang benar-benar baru.

Saran untuk startup

Gary Tan: Pertanyaan terakhir. Banyak orang di sini yang punya latar belakang teknologi mendalam dan ingin membangun sesuatu selevel Anda. Anda adalah salah satu organisasi riset AI terbesar di dunia. Dari pengalaman Anda di garis depan riset AGI, apa hal yang Anda tahu sekarang tapi berharap tahu saat usia 25 tahun?

Demis Hassabis: Kita sebenarnya sudah membahas sebagian. Anda akan menemukan bahwa mengikuti masalah sulit dan masalah sederhana itu sebenarnya sama sulitnya, hanya caranya berbeda. Ada tantangan berbeda di setiap bidang. Tapi hidup ini singkat, dan energi terbatas, jadi lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain. Pilih berdasarkan itu.

Selain itu, saya rasa dalam beberapa tahun ke depan, kombinasi lintas bidang akan menjadi lebih umum, dan AI akan memudahkan kolaborasi lintas disiplin.

Terakhir, tergantung pada garis waktu AGI Anda. Saya memperkirakan sekitar 2030. Kalau Anda mulai proyek teknologi mendalam hari ini, biasanya perjalanan sekitar sepuluh tahun. Jadi, Anda harus memasukkan kemungkinan munculnya AGI ke dalam perencanaan. Apa artinya? Tidak selalu buruk, tapi harus dipertimbangkan. Apakah proyek Anda bisa memanfaatkan AGI? Bagaimana sistem AGI akan berinteraksi dengan proyek Anda?

Kembali ke hubungan antara AlphaFold dan sistem AI umum, saya membayangkan Gemini, Claude, atau sistem umum serupa akan memanggil sistem khusus seperti AlphaFold sebagai alat. Saya tidak percaya kita akan memasukkan semuanya ke dalam satu sistem besar.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
SKHynixTopsKOSPIByMarketCap
1,36M Popularitas
#
EthereumFoundationRestructuresForEfficiency
94,26M Popularitas
#
IsraelStrikesIranBTCPlunges
62,52K Popularitas
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
263,04K Popularitas
#
TradFiCFDGoldMaster
2,18M Popularitas

Disematkan

peta situs

Wawancara dengan Pendiri DeepMind: Arsitektur AGI, Status Agen, dan Terobosan Ilmiah dalam Sepuluh Tahun Mendatang

Pengantar editor

Kutipan Paling Berkesan

Rencana dan garis waktu AGI

Memori dan jendela konteks

Kekurangan penalaran

Agent dan kreativitas

Distilasi dan model kecil

Penemuan ilmiah dan "Tes Einstein"

Saran untuk startup teknologi mendalam

Jalur Realisasi AGI

Distilasi dan model kecil

Memori dan penalaran

Kemampuan Agent yang sebenarnya

Open source dan model multimodal

Terobosan ilmiah berikutnya

Pengalaman Sukses

Saran untuk startup

Topik Trending

SKHynixTopsKOSPIByMarketCap

EthereumFoundationRestructuresForEfficiency

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

TradFiCFDGoldMaster

Disematkan