Antes de Meta, a nova responsável por notícias, Campbell Brown, fundou a Forum AI, dedicando 17 meses a avaliar sistematicamente a qualidade da informação dos principais modelos de IA, descobrindo que Gemini citou informações de sites oficiais do Partido Comunista Chinês ao tratar de reportagens não relacionadas à China, e que quase todos os modelos testados apresentavam uma inclinação política à esquerda.
(Prévia: A IA destrói a tradição de 133 anos da Universidade de Princeton: quando "cola" começa a se tornar um consenso)
(Complemento de contexto: 97.895 diálogos de fóruns subterrâneos mostram que: a comunidade hacker também odeia IA)

Índice deste artigo

Alternar

A questão que ninguém está testando
Erros fluentes, mais difíceis de detectar do que o silêncio
Regulamentação forçando, não uma consciência moral

Brown é jornalista de formação, trabalhou na CNN como apresentadora, depois virou responsável por notícias no Meta, gerenciando diretamente as políticas de apresentação de notícias do Facebook para seus 3 bilhões de usuários globais.

Essa posição lhe deu uma visão de perto de como "as plataformas moldam o fluxo de informações". Ela deixou o Meta há 17 meses e fundou a Forum AI em Nova York, especializada em uma tarefa que empresas de modelos fundamentais geralmente pulam: avaliar sistematicamente se as informações fornecidas pela IA são precisas, justas e apresentam múltiplas perspectivas.

A questão que ninguém está testando

O produto principal da Forum AI é uma estrutura de referência de eventos geopolíticos.

Funciona assim: a Forum AI convida um grupo de consultores de ponta, cada um com espectros políticos e formações diferentes: Niall Ferguson, Fareed Zakaria, o ex-secretário de Estado dos EUA Tony Blinken, o ex-líder da minoria na Câmara Kevin McCarthy, a ex-conselheira de segurança nacional Anne Neuberger… para avaliar, pontuando individualmente, as respostas de modelos de IA mainstream sobre um mesmo evento geopolítico complexo.

Atualmente, a Forum AI atingiu um limiar de consenso de cerca de 90% com especialistas humanos, tornando suas avaliações uma referência defensável, e não apenas uma opinião pessoal.

Brown identificou problemas em três níveis, cada um mais difícil de corrigir do que o anterior do ponto de vista técnico.

Primeiro nível: falhas na lógica de seleção de fontes. Gemini, ao tratar de reportagens não relacionadas à China, citou conteúdos de sites oficiais do Partido Comunista Chinês. Isso não é um erro factual comum, mas uma questão de lógica na filtragem de fontes: a IA apenas julga "isto é texto, isto é link", sem avaliar "qual é a postura dessa fonte, sua credibilidade, se tem uma intenção política clara".

A política inerente às fontes não é visível no fluxo de saída da IA.

Segundo nível: viés político estrutural. Quase todos os modelos mainstream testados demonstraram inclinação à esquerda. Isso não é uma teoria da conspiração, mas uma consequência natural da distribuição do corpus de treinamento. A IA aprende a partir de textos — notícias, artigos acadêmicos, posts em redes sociais — que, em geral, carregam uma tendência política específica, e ela tende a reproduzir esse tom e esse enquadramento de postura.

O conteúdo predominante na internet em inglês — mídia mainstream, artigos acadêmicos, posts em redes sociais — possui uma inclinação política particular, e os modelos treinados herdam essa inclinação, muitas vezes sem perceber.

Mais complicado ainda: esse viés não é um bug que pode ser simplesmente corrigido, mas uma parte embutida na lógica de cada saída do modelo.

Terceiro nível: falta de contexto e múltiplas perspectivas. Brown afirma que os modelos atuais geralmente carecem de "contexto de fundo, múltiplas perspectivas e transparência argumentativa". As respostas da IA são declarações, não uma estrutura do tipo "para o grupo A isso representa X, para o grupo B representa Y, e a divergência fundamental é...".

Ela fornece uma resposta, mas não indica de qual ângulo ela foi derivada.

Erros fluentes, mais difíceis de detectar do que o silêncio

Brown aponta uma cegueira estrutural: as empresas de modelos fundamentais, ao avaliar e classificar modelos, priorizam habilidades matemáticas, de codificação e raciocínio lógico, enquanto a precisão da informação e a diversidade política quase nunca aparecem nas principais listas de testes de referência.

Não é difícil entender o motivo. Código tem certo ou errado, testes mostram isso. Questões matemáticas têm respostas padrão, a precisão pode ser calculada. Mas "o que constitui uma reportagem geopolítica precisa e justa" — quem decide? Quantas pessoas com diferentes posições são necessárias para formar um consenso? Essa questão não tem uma solução de engenharia.

No processo de desenvolvimento de produtos liderado por engenheiros, baseado em rankings de testes, ela é sistematicamente ignorada. Como resultado, a precisão da informação é quase invisível na avaliação de capacidades da IA.

O custo de pular essa questão pode ser visto em um caso concreto: o ano passado, Nova York realizou uma auditoria de conformidade em seu sistema de recrutamento por IA, para verificar se as ferramentas de triagem usadas pelos empregadores violavam leis anti-discriminação. Segundo o relatório, mais da metade dos casos não detectaram violações.

O problema não é a baixa taxa de violações, mas que isso pode indicar que as ferramentas de auditoria por IA não são precisas o suficiente para detectar problemas — ou seja, o problema real pode nem estar lá.

Esse é o ponto central do argumento de Brown: o problema da IA não é apenas fornecer fatos incorretos, mas fazer as pessoas aceitarem esses fatos com confiança. Uma pessoa sabe que não sabe algo, ao menos tem a chance de pesquisar. Mas quando a IA, com uma fala fluente, confiante e sem hesitações, fornece uma resposta errada, a maioria dos usuários não tem motivo para duvidar.

Erros fluentes, mais difíceis de detectar do que o silêncio, e mais difíceis de corrigir.

Regulamentação forçando, não uma consciência moral

A avaliação de Brown é direta: o que vai impulsionar mudanças não será a pressão moral ou a opinião pública, mas o risco de conformidade empresarial.

A tese dela tem uma base realista: no atual sistema de incentivos da indústria de IA, ninguém tem motivo forte o suficiente para resolver o problema de forma proativa, até que seu custo se torne inegável. Decisões de crédito, seguros, recrutamento — esses cenários de decisão por IA estão sujeitos às leis existentes.

Quando uma saída de IA apresenta resultados discriminatórios ou imprecisos, a responsabilidade recai sobre a empresa que a utiliza. Essa pressão, por sua vez, se transfere aos fornecedores de modelos, exigindo que entreguem saídas auditáveis, verificáveis e com garantias de precisão. Não porque acham que isso é moralmente correto, mas porque seus clientes empresariais começam a exigir isso em contratos.

A Lerer Hippeau liderou, no ano passado, um investimento seed de 3 milhões de dólares na Forum AI. Esse valor é pequeno no setor de IA, mas representa um julgamento: "avaliação de IA" é um negócio, e a demanda por esse serviço pode crescer mais rápido do que se imagina.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
ShareYourUSStocksWinNvidia
3.71M Popularidade
#
BitcoinRalliesOver5Percent
499.13M Popularidade
#
IsraelStrikesIranBTCPlunges
56.35K Popularidade
#
WinGoldBarsWithGrowthPoints
1.35M Popularidade
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.81M Popularidade

Fixado

sitemap

Ex-executivo de notícias da Meta investiga: quase todos os modelos de IA tendem à esquerda politicamente, Gemini já citou veículos oficiais do Partido Comunista Chinês

A questão que ninguém está testando

Erros fluentes, mais difíceis de detectar do que o silêncio

Regulamentação forçando, não uma consciência moral

Tendências

ShareYourUSStocksWinNvidia

BitcoinRalliesOver5Percent

IsraelStrikesIranBTCPlunges

WinGoldBarsWithGrowthPoints

StrongNonfarmPayrollsRekindleRateHikeFear

Fixado