تقنية ميتا السوداء: ارتداء خوذة تجعل الذكاء الاصطناعي يقرأ دماغك، دقة النص تصل إلى 61%

تطلق Meta هذا الأسبوع Brain2Qwerty v2، وهو نظام ذكاء اصطناعي غير جراحي لتحويل الدماغ إلى نص دون الحاجة لعملية جراحية. يسجل النشاط العصبي للدماغ عبر ماسح MEG (تخطيط الدماغ المغناطيسي) على شكل خوذة، ثم يفك تشفير الجمل التي يريد المستخدم كتابتها مباشرة عبر نموذج تعلم عميق من البداية إلى النهاية، بمتوسط دقة كلمات يبلغ 61%، وهو قفزة كبيرة مقارنة بحوالي 8% للطرق غير الجراحية السابقة. (ملخص سابق: ماسك: أول مستخدم لواجهة الدماغ الحاسوبية Neuralink "تعافى بشكل شبه كامل"! يمكنه التحكم في مؤشر الفأرة بالعقل) (خلفية إضافية: سامسونج تحصل على طلبية رقاقة الجيل الرابع من Neuralink لواجهة الدماغ الحاسوبية، لا تقرأ فقط بل تستطيع "الكتابة" في الدماغ) فهرس المقال تبديل

  • استخراج المعنى من الضجيج: ما يفعله النموذج من البداية إلى النهاية
  • لماذا تخسر الطرق غير الجراحية أمام الجراحة لفترة طويلة
  • نية المصدر المفتوح: تسريع الذكاء الاصطناعي، يجب رفع خط الأساس أولاً

غرس أقطاب كهربائية عبر فتح الجمجمة أم ارتداء خوذة؟ هذا هو الصراع الأساسي في مجال واجهات الدماغ الحاسوبية: Neuralink التابعة لماسك تختار الأولى، بزرع رقاقة في قشرة الدماغ؛ بينما تختار Meta الثانية، بإطلاق Brain2Qwerty v2، الذي يرفع متوسط دقة الكلمات من حوالي 8% للطرق غير الجراحية إلى 61% دفعة واحدة، مقتربًا من المستوى الذي لم يتحقق سابقًا إلا عبر الجراحة. لا شقوق، لا غرسات، فقط خوذة ونموذج تعلم عميق.

استخراج المعنى من الضجيج: ما يفعله النموذج من البداية إلى النهاية

MEG، الاسم الكامل تخطيط الدماغ المغناطيسي، رسم مغناطيسي للدماغ. ببساطة، هو استخدام أجهزة استشعار فائقة التوصيل لكشف المجالات المغناطيسية الدقيقة الناتجة عن نشاط الخلايا العصبية، وهو جهاز تصوير دماغي غير جراحي شائع في مختبرات علم الأعصاب، ولا يتطلب زرع أي شيء داخل الدماغ. طريقة Brain2Qwerty v2 هي: جعل المشاركين يرتدون ماسح MEG على شكل خوذة، وتسجيل نشاط الدماغ أثناء الكتابة، ثم تغذية هذه الإشارات العصبية الخام مباشرة إلى نموذج ذكاء اصطناعي من البداية إلى النهاية (end-to-end)، ببساطة، لا توجد خطوات وسيطة مصممة يدويًا بين الإدخال والإخراج، بل يترك النموذج ليتعلم مسار فك التشفير بأكمله بنفسه، ويعيد بناء الجمل التي يريد المستخدم كتابتها. الطريقة السابقة كانت تصميم pipeline يدويًا: أولاً كشف أحداث عصبية محددة (مثل استجابة الدماغ عند ظهور حرف)، ثم استنتاج النص تدريجيًا. Brain2Qwerty v2 تخلى عن هذا المسار، وبدلاً من ذلك استخدم التعلم العميق لفك التشفير مباشرة من الإشارات الدماغية الخام الفوضوية، ثم استخدم نموذج لغة كبير لتصحيح الأخطاء الناتجة عن الضجيج بناءً على السياق الدلالي. حجم التدريب: حوالي 22,000 جملة، 9 متطوعين، سجل كل منهم 10 ساعات من البيانات. تقول Meta أن الدقة ستستمر في التحسن مع زيادة حجم بيانات التدريب، وهذا الرقم لم يصل بعد إلى السقف. كمرجع مقارن، بلغ معدل خطأ الأحرف (CER) للإصدار المبكر v1 في ظل ظروف MEG حوالي 32%، وعند استبدال المهمة بـ EEG (تخطيط كهربية الدماغ) ارتفع إلى 67%. دقة الكلمات البالغة 61% لـ v2 تمثل عبور النظام بأكمله لعتبة بمقدار ترتيب من حيث الحجم.

لماذا تخسر الطرق غير الجراحية أمام الجراحة لفترة طويلة

الاتجاه الرئيسي لأبحاث واجهات الدماغ الحاسوبية لعقود كان نحو الأنظمة المزروعة. السبب مباشر: التسجيل مباشرة بجوار الخلايا العصبية يعطي إشارات نظيفة وزمن استجابة منخفض ودقة عالية. Neuralink و Synchron و Merge Labs المدعومة من Sam Altman كلها تسلك هذا الطريق. نقطة الضعف القاتلة للطرق غير الجراحية هي نسبة الإشارة إلى الضوضاء. الجمجمة وفروة الرأس والشعر كلها طبقات تخفف الإشارة، وEEG الأكثر تضررًا. MEG لديها نفاذية مغناطيسية أفضل نسبيًا، لكن الخوذة باهظة الثمن، حيث تكلف الأجهزة ملايين الدولارات، وتحتاج إلى بيئة خاصة لحماية المجال المغناطيسي الخارجي، مما يفسر بقاء MEG لفترة طويلة في مختبرات علم الأعصاب وليس في التطبيقات السريرية. ومع ذلك، فإن اختيار Meta لطريق MEG له منطقه الخاص. تواجه الواجهات المزروعة مشكلتين: مخاطر الجراحة نفسها، ومشكلة صيانة الغرسات داخل الدماغ على المدى الطويل. بالنسبة للمرضى الذين فقدوا القدرة على التواصل بسبب أمراض الدماغ، فإن عقبة الجراحة غالبًا ما تستبعد معظم المستفيدين المحتملين مباشرة. إذا تمكنت الطرق غير الجراحية من تحقيق دقة عالية بما فيه الكفاية، فستتمكن من تغطية الفئات التي لا تستطيع الواجهات المزروعة الوصول إليها دون أي جراحة. أصدرت Meta أيضًا كود النظام ومجموعة البيانات كجزء من مشروع الدماغ الرقمي (Digital Brain Project)، وأنشأت صندوقًا بقيمة 5 ملايين دولار لدعم بناء مجموعات بيانات علم الأعصاب المفتوحة. نُشرت الورقة البحثية ذات الصلة في Nature Neuroscience.

نية المصدر المفتوح: تسريع الذكاء الاصطناعي، يجب رفع خط الأساس أولاً

إصدار Meta للكود والبيانات في هذا التوقيت له نية استراتيجية واضحة. أحد اختناقات أبحاث BCI (واجهات الدماغ الحاسوبية) غير الجراحية هو نقص مجموعات البيانات العصبية العامة واسعة النطاق. كل مختبر يجمع البيانات الأساسية بشكل متكرر، بكفاءة منخفضة للغاية. صندوق Meta البالغ 5 ملايين دولار يستهدف هذه النقطة تحديدًا، لتمكين المجتمع من بناء بيانات مرجعية معًا، وتسريع منحنى التعلم للمجال بأكمله. في نفس الفترة، هناك عدد من اللاعبين الجديرين بالمتابعة في معسكر غير الجراحي: أطلقت Neurable في سبتمبر 2024 سماعات EEG مدعومة بالذكاء الاصطناعي؛ وشركة AlterEgo المشتقة من MIT تسلك طريقًا آخر، حيث تكشف الإشارات العصبية العضلية الصامتة في الوجه والحلق، وتحول الكلام غير المنطوق إلى نص وأوامر. تختلف المسارات، لكن السؤال واحد: هل من الممكن جعل الآلة تفهم ما يفكر فيه الشخص وما يريد قوله دون فتح الجمجمة؟ تظهر العملية الهندسية لـ Brain2Qwerty v2 تفصيلًا: تركت Meta وكلاء الذكاء الاصطناعي يستكشفون بشكل منهجي مساحات التحسين المحتملة لخط أنابيب فك التشفير، ثم اختار المهندسون التكوين النهائي للتدريب. هذه ممارسة قياسية لاستخدام الذكاء الاصطناعي لتصميم أنظمة الذكاء الاصطناعي، لكنها في مهمة فك تشفير إشارات الدماغ تكون ذات أهمية رمزية أكبر من الهندسية. 61% مقابل 8% هو تباين لافت. لكن السؤال الأكثر أهمية هو: إذا زادت الدقة خطيًا مع كمية البيانات، أين سيتوقف هذا الخط؟

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت