Teknologi hitam Meta: Pakai helm untuk membaca otakmu oleh AI, akurasi teks mencapai 61%

Meta minggu ini meluncurkan Brain2Qwerty v2, sebuah sistem AI non-invasif yang mengubah pikiran menjadi teks tanpa operasi. Melalui pemindai MEG (magnetoensefalografi) berbentuk helm yang merekam aktivitas saraf otak, kemudian model pembelajaran mendalam ujung-ke-ujung secara langsung mendekode kalimat yang ingin diketik pengguna, dengan akurasi kata rata-rata mencapai 61%, melonjak signifikan dibandingkan metode non-invasif sebelumnya yang sekitar 8%.
(Ringkasan sebelumnya: Musk: Pengguna pertama antarmuka otak-komputer Neuralink "hampir pulih sepenuhnya"! Dapat mengendalikan kursor mouse dengan pikiran)
(Latar belakang tambahan: Samsung mendapat pesanan chip generasi keempat Neuralink antarmuka otak-komputer, tidak hanya membaca tetapi juga "menulis" ke otak)

Daftar Isi

Beralih

  • Mengekstrak makna dari kebisingan: Apa yang dicapai model ujung-ke-ujung
  • Mengapa metode non-invasif kalah lama dari operasi
  • Niat open-source: AI dipercepat, baseline harus dinaikkan terlebih dahulu

Menanamkan elektroda melalui kraniotomi, atau memakai helm? Ini adalah perdebatan jalur paling inti di bidang antarmuka otak-komputer: Neuralink milik Musk memilih yang pertama, menanamkan chip di korteks serebral; Meta memilih yang terakhir, meluncurkan Brain2Qwerty v2, yang meningkatkan akurasi kata rata-rata dari sekitar 8% dengan metode non-invasif menjadi 61%, mendekati level yang sebelumnya hanya dapat dicapai dengan operasi bedah.
Tidak ada sayatan, tidak ada implan, hanya helm dan satu set model pembelajaran mendalam.

Mengekstrak makna dari kebisingan: Apa yang dicapai model ujung-ke-ujung

MEG, singkatan dari magnetoensefalografi, pencitraan magnetik otak. Sederhananya, menggunakan sensor superkonduktor untuk mendeteksi medan magnet sangat kecil yang dihasilkan saat aktivitas neuron, merupakan perangkat pencitraan otak non-invasif yang umum digunakan di laboratorium ilmu saraf, tanpa perlu menanamkan apa pun di otak.
Pendekatan Brain2Qwerty v2 adalah: membuat subjek memakai pemindai MEG berbentuk helm, merekam aktivitas otak sambil mengetik, dan memasukkan sinyal saraf mentah ini langsung ke model AI ujung-ke-ujung (end-to-end). Sederhananya, tidak ada langkah perantara yang dirancang secara manual antara input dan output, membiarkan model mempelajari sendiri seluruh jalur dekode, untuk merekonstruksi kalimat yang ingin diketik pengguna.
Pendekatan sebelumnya adalah merancang pipeline secara manual: pertama mendeteksi peristiwa saraf tertentu (misalnya reaksi otak saat huruf muncul), kemudian secara bertahap menyimpulkan teks. Brain2Qwerty v2 meninggalkan jalur ini, beralih menggunakan pembelajaran mendalam untuk mendekode langsung dari sinyal otak mentah yang kacau, kemudian menggunakan model bahasa besar untuk memperbaiki kesalahan akibat kebisingan berdasarkan konteks semantik.
Skala pelatihan: sekitar 22.000 kalimat, 9 sukarelawan, masing-masing merekam data selama 10 jam. Meta mengatakan akurasi akan terus meningkat seiring bertambahnya data pelatihan, angka ini belum mencapai batas atas.
Sebagai perbandingan, versi awal v1 dalam kondisi MEG memiliki tingkat kesalahan karakter (CER) sekitar 32%, tugas yang sama dengan EEG (elektroensefalografi) meningkat menjadi 67%. Akurasi kata 61% v2 mewakili sistem secara keseluruhan melampaui ambang batas satu orde magnitudo.

Mengapa metode non-invasif kalah lama dari operasi

Jalur utama penelitian antarmuka otak-komputer selama beberapa dekade mengarah ke implan. Alasannya langsung: merekam langsung dari neuron, sinyal bersih, latensi rendah, presisi tinggi. Neuralink, Synchron, dan Merge Labs yang didukung Sam Altman, semuanya mengambil jalur ini.
Kelemahan fatal metode non-invasif adalah rasio sinyal terhadap noise. Tulang tengkorak, kulit kepala, rambut semuanya merupakan lapisan pelemahan sinyal, terutama pada EEG. Penetrasi medan magnet MEG relatif lebih baik, tetapi helmnya mahal, perangkat bisa mencapai jutaan dolar, dan memerlukan lingkungan khusus yang terlindung dari medan magnet eksternal, ini menjelaskan mengapa MEG lama tinggal di laboratorium ilmu saraf, bukan aplikasi klinis.
Meskipun demikian, pilihan Meta terhadap jalur MEG memiliki logikanya. Antarmuka implan menghadapi dua masalah: risiko operasi itu sendiri, dan masalah pemeliharaan implan jangka panjang di otak. Bagi pasien yang kehilangan kemampuan komunikasi akibat lesi otak, hambatan operasi seringkali secara langsung mengecualikan sebagian besar calon penerima manfaat.
Jika jalur non-invasif dapat mencapai akurasi yang cukup tinggi, maka dapat menjangkau populasi yang tidak dapat dijangkau implan tanpa operasi sama sekali.
Meta juga merilis kode sistem dan kumpulan data sebagai bagian dari Proyek Otak Digital (Digital Brain Project) -nya, dan mendirikan dana sebesar $5 juta untuk mendukung pembangunan kumpulan data ilmu saraf terbuka. Makalah terkait diterbitkan di Nature Neuroscience.

Niat open-source: AI dipercepat, baseline harus dinaikkan terlebih dahulu

Meta merilis kode dan data pada titik waktu ini dengan maksud strategis yang jelas.
Salah satu hambatan penelitian BCI (antarmuka otak-komputer) non-invasif adalah kurangnya kumpulan data saraf skala besar yang terbuka. Setiap laboratorium mengumpulkan data dasar secara berulang, efisiensi sangat rendah. Dana $5 juta Meta justru menyasar bagian ini, memungkinkan komunitas bersama-sama membangun data dasar, mempercepat kurva pembelajaran seluruh bidang.
Pada periode yang sama, ada beberapa pemain di kubu non-invasif yang layak diikuti: Neurable meluncurkan headphone EEG yang didukung AI pada September 2024; perusahaan spin-off MIT AlterEgo mengambil jalur lain, mendeteksi sinyal neuromuskular diam dari wajah dan tenggorokan, mengubah ucapan yang tidak terucapkan menjadi teks dan perintah. Jalurnya berbeda, kesadaran masalahnya sama: mungkinkah, tanpa kraniotomi, membuat mesin memahami apa yang dipikirkan dan ingin dikatakan seseorang?
Proses rekayasa Brain2Qwerty v2 sendiri juga mengungkap detail: Meta membiarkan agen AI pertama-tama secara sistematis mengeksplorasi ruang optimasi pipeline dekode, kemudian insinyur memilih konfigurasi pelatihan akhir dari situ. Ini adalah praktik standar menggunakan AI untuk merancang sistem AI, tetapi diterapkan pada tugas dekode sinyal otak, makna simbolis lebih besar dari makna rekayasa.
61% vs 8%, adalah perbandingan yang mencolok. Namun pertanyaan yang lebih patut diperhatikan: jika akurasi meningkat secara linear seiring jumlah data, di mana garis ini akan berhenti?

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan