Meta tecnología negra: usar un casco para que la IA lea tu cerebro, la precisión del texto alcanza el 61%.

Meta lanzó esta semana Brain2Qwerty v2, un sistema de IA no invasivo para convertir la actividad cerebral en texto sin cirugía. Utiliza un escáner MEG (magnetoencefalografía) tipo casco para registrar la actividad neuronal del cerebro, y luego decodifica directamente las oraciones que el usuario quiere escribir mediante un modelo de aprendizaje profundo de extremo a extremo, alcanzando una precisión promedio por palabra del 61%, un gran salto en comparación con el método no invasivo anterior que rondaba el 8%. (Resumen anterior: Musk: el primer probador de la interfaz cerebro-computadora Neuralink "casi completamente recuperado"; puede controlar el cursor del ratón con la mente) (Contexto adicional: Samsung obtiene el pedido del chip de cuarta generación de Neuralink, no solo puede leer sino también "escribir" en el cerebro) Índice de este artículo Alternar

  • Extraer significado del ruido: ¿Qué logra el modelo de extremo a extremo?
  • ¿Por qué los métodos no invasivos han perdido durante mucho tiempo frente a la cirugía?
  • La intención del código abierto: acelerar la IA, primero elevar el punto de referencia ¿Implantar electrodos mediante craneotomía, o ponerse un casco? Esta es la disputa central de rutas en el campo de las interfaces cerebro-computadora: Neuralink de Musk eligió lo primero, enterrando chips en la corteza cerebral; Meta eligió lo segundo, lanzando Brain2Qwerty v2, que elevó la precisión promedio por palabra de aproximadamente el 8% en métodos no invasivos al 61%, acercándose al nivel que antes solo se lograba con cirugía. Sin incisiones, sin implantes, solo un casco y un conjunto de modelos de aprendizaje profundo.

Extraer significado del ruido: ¿Qué logra el modelo de extremo a extremo?

MEG, nombre completo magnetoencefalografía, mapa magnético cerebral. En términos simples, utiliza sensores superconductores para detectar los campos magnéticos débiles generados por la actividad neuronal. Es un dispositivo de imagen cerebral no invasivo común en laboratorios de neurociencia, que no requiere implantar nada en el cerebro. El enfoque de Brain2Qwerty v2 es: hacer que los sujetos usen un escáner MEG tipo casco, registren la actividad cerebral mientras escriben, y alimenten estas señales neuronales sin procesar directamente a un modelo de IA de extremo a extremo. En términos simples, no hay pasos intermedios diseñados manualmente entre la entrada y la salida; el modelo aprende por sí mismo toda la ruta de decodificación para reconstruir las oraciones que el usuario quiere escribir. El enfoque anterior era diseñar manualmente un pipeline: primero detectar eventos neuronales específicos (por ejemplo, la reacción cerebral al aparecer una letra), y luego deducir el texto paso a paso. Brain2Qwerty v2 abandonó este camino, y en su lugar utiliza aprendizaje profundo para decodificar directamente de las señales cerebrales caóticas, y luego usa modelos de lenguaje grandes para corregir los errores causados por el ruido según el contexto semántico. Escala de entrenamiento: aproximadamente 22,000 oraciones, 9 voluntarios, cada uno grabó 10 horas de datos. Meta dice que la precisión seguirá mejorando a medida que aumente la cantidad de datos de entrenamiento, y esta cifra aún no ha alcanzado su límite. Como referencia comparativa, la versión temprana v1 tenía una tasa de error de caracteres (CER) de aproximadamente el 32% en condiciones MEG, mientras que la misma tarea con EEG (electroencefalografía) subía al 67%. La precisión del 61% de v2 representa que el sistema ha superado un umbral de orden de magnitud en general.

¿Por qué los métodos no invasivos han perdido durante mucho tiempo frente a la cirugía?

La corriente principal de la investigación en interfaces cerebro-computadora ha apuntado durante décadas hacia los métodos implantables. La razón es directa: al registrar directamente junto a las neuronas, la señal es limpia, con baja latencia y alta precisión. Neuralink, Synchron y Merge Labs apoyado por Sam Altman, todos siguen este camino. La debilidad fatal de los métodos no invasivos es la relación señal-ruido. El cráneo, el cuero cabelludo y el cabello son capas de atenuación de la señal, especialmente en EEG. La penetración del campo magnético de MEG es relativamente mejor, pero el casco es costoso, los dispositivos cuestan millones de dólares y requieren un entorno especial para bloquear campos magnéticos externos, lo que explica por qué MEG ha permanecido durante mucho tiempo en laboratorios de neurociencia y no en aplicaciones clínicas. No obstante, la elección de Meta por la ruta MEG tiene su lógica. Las interfaces implantables enfrentan dos problemas: el riesgo de la cirugía en sí y el mantenimiento a largo plazo del implante en el cerebro. Para los pacientes que han perdido la capacidad de comunicarse debido a lesiones cerebrales, el umbral quirúrgico a menudo excluye directamente a la mayoría de los posibles beneficiarios. Si la ruta no invasiva puede alcanzar una precisión suficientemente alta, podría cubrir a la población que los implantes no pueden alcanzar, sin necesidad de cirugía. Meta también publicó el código del sistema y el conjunto de datos como parte de su Digital Brain Project, y estableció un fondo de 5 millones de dólares para apoyar la construcción de conjuntos de datos abiertos de neurociencia. El artículo relacionado fue publicado en Nature Neuroscience.

La intención del código abierto: acelerar la IA, primero elevar el punto de referencia

Que Meta publique el código y los datos en este momento tiene una intención estratégica clara detrás. Uno de los cuellos de botella en la investigación de BCI (interfaz cerebro-computadora) no invasiva es la falta de conjuntos de datos neuronales públicos a gran escala. Cada laboratorio está recolectando datos básicos repetidamente, con una eficiencia muy baja. El fondo de 5 millones de dólares de Meta se dirige precisamente a este punto, permitiendo que la comunidad construya conjuntamente datos de referencia, acelerando la curva de aprendizaje de todo el campo. Al mismo tiempo, hay varios actores en el campo no invasivo que vale la pena seguir: Neurable lanzó en septiembre de 2024 unos auriculares EEG impulsados por IA; la empresa derivada del MIT, AlterEgo, sigue otro camino, detectando señales neuromusculares silenciosas de la cara y la garganta para convertir el lenguaje no pronunciado en texto e instrucciones. Caminos diferentes, pero la misma conciencia del problema: ¿es posible que las máquinas entiendan lo que las personas piensan y quieren decir sin necesidad de abrir el cráneo? El proceso de ingeniería de Brain2Qwerty v2 también revela un detalle: Meta permitió que agents de IA exploraran sistemáticamente el posible espacio de optimización del pipeline de decodificación, y luego los ingenieros seleccionaron la configuración final de entrenamiento. Esta es una práctica estándar de usar IA para diseñar sistemas de IA, pero aplicada a la tarea de decodificación de señales cerebrales, tiene más significado simbólico que ingenieril. El 61% frente al 8% es un contraste llamativo. Pero la pregunta que merece más atención es: si la precisión aumenta linealmente con la cantidad de datos, ¿dónde se detendrá esta línea?

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado