Meta tecnologia negra: capacete permite que IA leia seu cérebro, precisão de texto atinge 61%

Meta lançou esta semana o Brain2Qwerty v2, um sistema de IA não invasivo de conversão cerebral para texto que não requer cirurgia. Através de um scanner MEG (magnetoencefalografia) em forma de capacete, regista a atividade neural do cérebro e, em seguida, utiliza um modelo de aprendizagem profunda de ponta a ponta para descodificar diretamente as frases que o utilizador pretende escrever, atingindo uma precisão média de palavras de 61%, um salto significativo face aos cerca de 8% dos métodos não invasivos anteriores. (Contexto anterior: Musk: primeiro utilizador da interface cérebro-máquina Neuralink 'quase totalmente recuperado'! Consegue controlar o cursor do rato com a mente) (Contexto adicional: Samsung ganhou encomenda do chip de quarta geração da Neuralink, não só lê mas também 'escreve' no cérebro) Índice Alternar

  • Extrair significado do ruído: o que o modelo ponta a ponta consegue fazer
  • Porque é que o método não invasivo tem perdido para a cirurgia durante tanto tempo
  • Intenção do código aberto: acelerar a IA, primeiro é preciso elevar a linha de base Implante de elétrodos com craniotomia, ou usar um capacete? Esta é a disputa central de abordagem no campo das interfaces cérebro-máquina: a Neuralink de Musk escolhe a primeira, implantando chips no córtex cerebral; a Meta escolhe a segunda, lançando o Brain2Qwerty v2, elevando a precisão média de palavras dos cerca de 8% dos métodos não invasivos para 61%, aproximando-se dos níveis que anteriormente apenas a cirurgia podia alcançar. Sem incisões, sem implantes, apenas um capacete e um modelo de aprendizagem profunda.

Extrair significado do ruído: o que o modelo ponta a ponta consegue fazer

MEG, nome completo magnetoencefalografia. Simplificando, utiliza sensores supercondutores para detetar os campos magnéticos extremamente fracos gerados pela atividade neuronal, é um dispositivo de imagem cerebral não invasivo comum em laboratórios de neurociência, não necessitando de implantar nada no cérebro. A abordagem do Brain2Qwerty v2 é: os participantes usam o scanner MEG em forma de capacete, registam a atividade cerebral enquanto escrevem, e alimentam esses sinais neurais brutos diretamente num modelo de IA de ponta a ponta, ou seja, sem etapas intermédias desenhadas manualmente entre a entrada e a saída, permitindo que o modelo aprenda todo o caminho de descodificação e reconstrua as frases que o utilizador pretende escrever. A abordagem anterior era conceber manualmente um pipeline: primeiro detetar eventos neurais específicos (como a reação cerebral ao aparecimento de letras) e depois deduzir o texto passo a passo. O Brain2Qwerty v2 abandonou este caminho, passando a usar aprendizagem profunda para descodificar diretamente os sinais cerebrais brutos e confusos, e depois usando grandes modelos de linguagem para corrigir erros causados pelo ruído com base no contexto semântico. Escala de treino: cerca de 22.000 frases, 9 voluntários, cada um com 10 horas de dados gravados. A Meta afirma que a precisão continuará a aumentar com mais dados de treino, e que este número ainda não atingiu o teto. Como referência de comparação, a versão inicial v1 tinha uma taxa de erro de caráter (CER) de cerca de 32% em condições MEG, que subia para 67% com EEG. A precisão de palavras de 61% do v2 representa que o sistema como um todo ultrapassou um limiar de ordem de grandeza.

Porque é que o método não invasivo tem perdido para a cirurgia durante tanto tempo

A abordagem principal na investigação de interfaces cérebro-máquina, durante décadas, tem sido a implantável. A razão é simples: gravar diretamente junto dos neurónios proporciona sinais limpos, baixa latência e alta precisão. A Neuralink, a Synchron e a Merge Labs apoiada por Sam Altman seguem este caminho. A fraqueza fatal do método não invasivo é a relação sinal-ruído. O crânio, o couro cabeludo e o cabelo são camadas de atenuação do sinal, especialmente no EEG. A penetração magnética do MEG é relativamente melhor, mas o capacete é caro, os dispositivos custam frequentemente milhões de dólares, e exigem um ambiente especial para proteger de campos magnéticos externos, o que explica porque o MEG permaneceu durante muito tempo nos laboratórios de neurociência, e não na aplicação clínica. Apesar disso, a escolha da Meta pela via MEG tem a sua lógica. As interfaces implantáveis enfrentam dois problemas: o risco da cirurgia em si e a manutenção do implante a longo prazo no cérebro. Para pacientes que perderam a capacidade de comunicar devido a lesões cerebrais, o obstáculo da cirurgia muitas vezes exclui diretamente a maioria dos potenciais beneficiários. Se a via não invasiva conseguir atingir uma precisão suficientemente alta, poderá cobrir, sem qualquer intervenção cirúrgica, a população que a via implantável não consegue alcançar. A Meta também publicou o código do sistema e o conjunto de dados como parte do seu Digital Brain Project, e estabeleceu um fundo de 5 milhões de dólares para apoiar a construção de conjuntos de dados abertos de neurociência. O artigo correspondente foi publicado na Nature Neuroscience.

Intenção do código aberto: acelerar a IA, primeiro é preciso elevar a linha de base

A Meta divulgar o código e os dados neste momento tem uma intenção estratégica clara. Um dos gargalos na investigação de BCI (interface cérebro-máquina) não invasiva é a falta de conjuntos de dados neurais públicos em grande escala. Cada laboratório está a recolher dados básicos repetidamente, com eficiência muito baixa. O fundo de 5 milhões de dólares da Meta visa precisamente este aspeto, permitindo que a comunidade construa dados de referência em conjunto, acelerando a curva de aprendizagem de todo o campo. No mesmo período, há outros intervenientes dignos de nota no campo não invasivo: a Neurable lançou em setembro de 2024 uns auriculares EEG impulsionados por IA; a AlterEgo, spin-off do MIT, segue outro caminho, detetando sinais neuromusculares silenciosos do rosto e da garganta, convertendo linguagem não dita em texto e comandos. Caminhos diferentes, mesma questão: é possível, sem abrir o crânio, fazer a máquina entender o que a pessoa pensa e quer dizer? O próprio processo de engenharia do Brain2Qwerty v2 também revela um detalhe: a Meta fez com que agentes de IA explorassem sistematicamente o espaço de otimização possível do pipeline de descodificação, e depois os engenheiros selecionaram a configuração final de treino. Esta é uma prática padrão de usar IA para projetar sistemas de IA, mas quando aplicada à tarefa de descodificação de sinais cerebrais, o significado simbólico supera o significado de engenharia. 61% contra 8% é um contraste marcante. Mas a questão mais notável é: se a precisão aumentar linearmente com a quantidade de dados, onde é que esta linha irá parar?

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado