Meta tecnologia negra: usar capacete para fazer a IA ler seu cérebro, taxa de precisão de texto chega a 61%

Meta lançou esta semana o Brain2Qwerty v2, um sistema de IA não invasivo de conversão cerebral em texto sem cirurgia. Ele usa um scanner MEG (magnetoencefalografia) em forma de capacete para registrar a atividade neural do cérebro e, em seguida, decodifica diretamente as frases que o usuário deseja digitar por meio de um modelo de aprendizado profundo de ponta a ponta, alcançando uma taxa média de precisão de palavras de 61%, um grande salto em relação aos cerca de 8% dos métodos não invasivos anteriores.
(Resumo anterior: Musk: primeiro usuário da interface cérebro-máquina Neuralink "quase totalmente recuperado"! Pode controlar o cursor do mouse com o pensamento)
(Complemento de contexto: Samsung fecha pedido do chip de quarta geração da interface cérebro-máquina Neuralink, não apenas lê, mas também "escreve" no cérebro)

Índice deste artigo

Alternar

  • Extraindo sentido do ruído: o que o modelo de ponta a ponta faz
  • Por que o método não invasivo perde para a cirurgia há tanto tempo
  • A intenção do código aberto: aceleração da IA, linha de base precisa ser elevada primeiro

Implantar eletrodos no crânio ou usar um capacete? Esta é a disputa central de rota no campo das interfaces cérebro-máquina: o Neuralink de Musk escolhe a primeira opção, implantando um chip no córtex cerebral; a Meta escolhe a segunda, lançando o Brain2Qwerty v2, que elevou a taxa de precisão média de palavras de cerca de 8% dos métodos não invasivos para 61%, aproximando-se do nível que antes só era alcançável com cirurgia.

Sem cortes, sem implantes, apenas um capacete e um modelo de aprendizado profundo.

Extraindo sentido do ruído: o que o modelo de ponta a ponta faz

MEG, sigla para magnetoencefalografia. Simplificando, usa sensores supercondutores para detectar os campos magnéticos extremamente fracos gerados pela atividade dos neurônios. É um dispositivo de imageamento cerebral não invasivo comum em laboratórios de neurociência, sem necessidade de implantar nada no cérebro.

O Brain2Qwerty v2 funciona assim: os participantes usam um scanner MEG em forma de capacete, registram a atividade cerebral enquanto datilografam, e alimentam esses sinais neurais brutos diretamente em um modelo de IA de ponta a ponta (end-to-end). Simplificando, não há etapas intermediárias projetadas manualmente entre a entrada e a saída; o modelo aprende sozinho todo o caminho de decodificação para reconstruir as frases que o usuário deseja digitar.

O método anterior era projetar pipelines manualmente: primeiro detectar eventos neurais específicos (como a resposta elétrica cerebral ao aparecimento de uma letra) e depois deduzir o texto passo a passo. O Brain2Qwerty v2 abandonou essa abordagem, usando aprendizado profundo para decodificar diretamente os sinais cerebrais brutos e caóticos, e depois usando grandes modelos de linguagem para corrigir erros introduzidos pelo ruído com base no contexto semântico.

Escala de treinamento: cerca de 22.000 frases, 9 voluntários, cada um gravou 10 horas de dados. A Meta afirma que a precisão continuará aumentando à medida que a quantidade de dados de treinamento cresce; esse número ainda não atingiu o teto.

Como referência de comparação, a versão inicial v1 tinha uma taxa de erro de caracteres (CER) de cerca de 32% em condições MEG, enquanto a mesma tarefa com EEG (eletroencefalografia) subia para 67%. A precisão de palavras de 61% do v2 representa que o sistema como um todo ultrapassou um limiar de ordem de magnitude.

Por que o método não invasivo perde para a cirurgia há tanto tempo

A rota principal da pesquisa em interfaces cérebro-máquina, por décadas, tem sido a implantável. A razão é direta: registrar diretamente junto aos neurônios fornece sinais limpos, baixa latência e alta precisão. Neuralink, Synchron e Merge Labs (apoiado por Sam Altman) seguem esse caminho.

A fraqueza fatal dos métodos não invasivos é a relação sinal-ruído. Crânio, couro cabeludo e cabelo são camadas de atenuação do sinal, especialmente no EEG. O MEG tem melhor penetração magnética, mas o capacete é caro, o equipamento custa milhões de dólares e requer um ambiente especial com blindagem contra campos magnéticos externos, o que explica por que o MEG permaneceu por muito tempo em laboratórios de neurociência, e não em aplicações clínicas.

Apesar disso, a escolha da Meta pela rota MEG tem sua lógica. As interfaces implantáveis enfrentam dois problemas: os riscos da cirurgia em si e a manutenção do implante no cérebro a longo prazo. Para pacientes que perderam a capacidade de comunicação devido a lesões cerebrais, a barreira cirúrgica muitas vezes exclui diretamente a maioria dos potenciais beneficiários.

Se a rota não invasiva atingir precisão suficientemente alta, poderá cobrir populações que os implantes não conseguem alcançar, sem necessidade de qualquer procedimento cirúrgico.

A Meta também publicou o código do sistema e o conjunto de dados como parte de seu Digital Brain Project, e criou um fundo de US$ 5 milhões para apoiar a construção de conjuntos de dados abertos de neurociência. O artigo relacionado foi publicado na Nature Neuroscience.

A intenção do código aberto: aceleração da IA, linha de base precisa ser elevada primeiro

A Meta tornar público o código e os dados neste momento tem uma intenção estratégica clara.

Um dos gargalos da pesquisa não invasiva em BCI (interface cérebro-máquina) é a falta de conjuntos de dados neurais públicos em grande escala. Cada laboratório está coletando dados básicos repetidamente, com eficiência extremamente baixa. O fundo de US$ 5 milhões da Meta visa exatamente esse ponto, permitindo que a comunidade construa dados de referência em conjunto, acelerando a curva de aprendizado de todo o campo.

No mesmo período, há alguns outros players no campo não invasivo que merecem atenção: a Neurable lançou em setembro de 2024 um fone de ouvido EEG movido a IA; a AlterEgo, uma empresa derivada do MIT, segue outro caminho, detectando sinais neuromusculares silenciosos no rosto e na garganta, convertendo a linguagem não falada em texto e comandos. Rotas diferentes, mas a mesma questão central: é possível, sem abrir o crânio, fazer a máquina entender o que a pessoa está pensando e querendo dizer?

O próprio processo de engenharia do Brain2Qwerty v2 também revela um detalhe: a Meta fez com que agentes de IA explorassem sistematicamente o espaço de otimização possível do pipeline de decodificação, e então os engenheiros selecionaram a configuração final de treinamento. Esta é uma prática padrão de usar IA para projetar sistemas de IA, mas quando aplicada à tarefa de decodificação de sinais cerebrais, tem mais significado simbólico do que prático.

61% contra 8% é um contraste marcante. Mas a questão mais digna de nota é: se a precisão aumenta linearmente com a quantidade de dados, onde essa linha vai parar?

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado