Meta monitora treinamento de computadores de funcionários IA vazamento de dados, oficial interrompe emergência investigação

Meta em 2026 de abril iniciou a "Iniciativa de Capacidade de Modelos", gravando localmente no computador dos funcionários nos EUA os movimentos do mouse, cliques e entradas de teclado, para treinar seus próprios modelos de IA.
O plano foi divulgado após uma violação de segurança interna: um funcionário submeteu um relatório de incidente de alta prioridade, indicando que os dados vazados continham prompts completos e transcrições palavra por palavra, conversas privadas, dados de desempenho de pessoal, além de classificações de sensibilidade de dados internos.
Meta anunciou a suspensão do plano para investigação, enfatizando que atualmente não há sinais de acesso indevido aos dados por parte dos funcionários.
(Antecedentes: ex-alto executivo da Meta dá conselho de emprego na era da IA: planejamento de carreira de dez anos está obsoleto, basta fazer essas duas coisas)
(Informação adicional: lista de membros do grupo secreto Dialog de Peter Thiel vazou, incluindo Elon Musk, genro de Trump, ex-CEO do Google e outros fundadores do Vale do Silício, além do secretário do Tesouro dos EUA)

Em abril deste ano, a Meta implantou um programa nos computadores dos funcionários nos EUA.
O nome do projeto é "Iniciativa de Capacidade de Modelos (MCI)", com o objetivo de coletar movimentos do mouse, ações de clique e entradas de teclado dos funcionários para treinar os próprios modelos de IA da Meta.

Mais tarde, a divulgação ocorreu porque um funcionário submeteu um relatório SEV (incidente de segurança de alta prioridade), ao descobrir que alguns dados haviam sido vazados.

Este plano é mais grave do que "monitoramento de funcionários"

O problema do MCI tem duas camadas. A primeira é o próprio plano: gravar as ações dos funcionários nos computadores para usar como material de treinamento de IA, o que já ultrapassa os limites de privacidade.
A Reuters relatou em maio de 2026 que as informações coletadas pelo MCI excederam o escopo inicialmente divulgado, e alguns dados foram armazenados sem criptografia.

A segunda camada é o conteúdo específico do vazamento.
De acordo com o relatório SEV, o vazamento não foi apenas de registros operacionais comuns, mas de: prompts completos e transcrições palavra por palavra, conversas privadas, dados de pessoal e desempenho, além da classificação de sensibilidade de dados internos da Meta (níveis 1 a 4).
Todos os funcionários da Meta podem acessar esses dados.

Simplificando, o que deveria ser apenas registros de operações coletados pelo sistema, incluindo conversas privadas e avaliações de desempenho dos funcionários, foi vazado, sem qualquer restrição de acesso interno.
Este não é um problema de "escopo excessivo de coleta de dados", mas uma questão de governança de dados, desde o design até a execução, que falhou.

Após a divulgação do incidente, a Meta declarou que o projeto foi cuidadosamente planejado e que medidas de privacidade foram implementadas,
"atualmente, não há sinais de acesso indevido aos dados por parte dos funcionários", mas o plano será suspenso enquanto a investigação prossegue.

Este é o próximo campo de batalha na questão dos dados de treinamento de IA

A capacidade dos modelos de IA depende em grande medida da qualidade e diversidade dos dados de treinamento.

Nos últimos anos, as estratégias de dados das empresas de tecnologia passaram por várias fases:
A primeira foi a coleta de dados públicos na internet;
A segunda, a compra ou licenciamento de conjuntos de dados específicos;
A terceira, o uso de dados gerados por interações dos usuários ao usar produtos — que é o que a OpenAI com o ChatGPT, o Google com seus diversos serviços fazem;
E agora, surge uma quarta fonte: o comportamento de trabalho dos próprios funcionários.

A lógica do MCI não é difícil de entender.
As ações diárias dos engenheiros, gerentes de produto e designers da Meta nos computadores representam um tipo de dado de comportamento humano de alta qualidade e alta densidade: o que eles pensam, como procuram informações, como resolvem problemas, como se comunicam com colegas.
Esse tipo de dado tem um valor considerável para treinar assistentes de IA que possam realmente ajudar no trabalho.

O problema é que essa fronteira ética é extremamente nebulosa.
Existe uma relação empregatícia entre funcionários e a empresa, e os dados de comportamento no local de trabalho podem ser considerados ativos da empresa?

Os funcionários realmente têm uma opção de "recusar" ou há consentimento forçado na prática?
Quando a coleta inclui não apenas dados de eficiência no trabalho, mas também conversas privadas e avaliações de desempenho, essa fronteira fica ainda mais difícil de manter.

Desde a acusação de que a OpenAI coletou legendas do YouTube, até a controvérsia da Adobe ao alterar seus termos de serviço para permitir o uso de obras de criadores para treinar IA, e a Meta usando cliques de funcionários como material de treinamento, a questão dos dados de treinamento de IA evoluiu de uma disputa de direitos sobre dados públicos para uma questão ética mais profunda sobre dados de comportamento privado.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado