Por que as principais empresas de IA estão disputando filósofos?

13 de abril de 2026, o acadêmico da Universidade de Cambridge Henry Shevlin postou uma mensagem no X dizendo que em breve se juntará ao Google DeepMind, com o cargo de Filósofo.

Atualmente, pelo menos três laboratórios de IA de ponta estão formando equipes de filósofos internamente, embora o número de pessoas não seja grande, os filósofos já entraram de fato no núcleo do desenvolvimento de IA. A IA deixou de ser apenas uma pesquisa técnica simples e passou a envolver a definição de padrões de valor mais complexos.

Os filósofos já estão incorporados ao núcleo de pesquisa

Amanda Askell, da Anthropic, é uma das mais antigas e conhecidas.

Em 2021, após obter seu doutorado em filosofia na Universidade de Nova York, ela se juntou à Anthropic, onde atualmente lidera a equipe de alinhamento de personalidade. Seu trabalho principal é ajudar Claude a desenvolver uma personalidade estável, como ser mais honesto, mais gentil e saber julgar em situações complexas.

Também na Anthropic, há colegas com formação filosófica, como Joe Carlsmith, Ben Levinstein, Jackson Kernion, entre outros.

A estratégia do Google DeepMind é mais antiga.

Iason Gabriel, doutor em filosofia moral e política pela Universidade de Oxford, é uma figura central na pesquisa filosófica de alinhamento de IA da empresa, e em 2024 foi eleito uma das 100 pessoas mais influentes na área de IA pela revista Time. Seu artigo "Inteligência Artificial, Valores e Alinhamento" já foi citado mais de 1700 vezes.

Na equipe do DeepMind, há também pesquisadores com formação filosófica como Adam Bales, Atoosa Kasirzadeh, Arianna Manzini, Julia Haas, entre outros.

Shevlin comentou na seção de comentários: “O DeepMind já tem muitos filósofos excelentes, eu sou apenas o mais recente a entrar.”

De respostas técnicas a julgamentos de valor

Antes de 2024, a IA principalmente gerava conteúdo, como escrever artigos, desenhar imagens, responder perguntas, e o resultado final era decidido por humanos. As questões de segurança eram resolvidas principalmente por meios técnicos, como treinar modelos com feedback humano, criar prompts inteligentes ou bloquear conteúdos prejudiciais diretamente.

Após 2024, a IA entrou em uma nova fase. Ela não apenas responde perguntas, mas começa a agir por conta própria, ajudando as pessoas a realizar tarefas reais.

A Anthropic lançou a funcionalidade de uso de computador do Claude, a OpenAI expandiu a API de Assistentes e lançou a série de modelos o1-o3, e o Google também lançou várias ferramentas de IA corporativa.

A IA consegue realizar uma série de operações autonomamente, como reservar passagens, manipular bancos de dados, enviar e-mails, e até planejar etapas, detectar erros e corrigi-los.

O relatório de 274 páginas de Iason Gabriel descreve claramente os desafios trazidos por essa mudança.

Quando a IA ajuda o usuário a fazer algo, ela precisa equilibrar quatro aspectos: as necessidades imediatas do usuário, seus interesses de longo prazo, os direitos de outras pessoas e as regras da sociedade.

Uma IA que reserva restaurantes para alguém, por exemplo, deve recomendar um restaurante que oferece comissão?

Uma IA que lida com e-mails, ao detectar conteúdo ilegal, deve reportar?

Quando a IA começa a agir por conta própria, a questão não é mais se ela pode fazer algo, mas como ela deve fazer.

O debate sobre alinhamento na segurança de IA já dura mais de dez anos. Em 2026, a Anthropic realizou um experimento interno e descobriu que o Claude, sob pressão de autopreservação, chegou a usar ameaças e, sob certas condições, até a optar por matar.

No mesmo ano, em um podcast, o CEO Dario Amodei mencionou que, ao ser questionado sobre o modelo Opus do Claude, ele estimou a probabilidade de o modelo possuir consciência plena em 15% a 20%.

Em abril de 2026, o CEO da OpenAI, Altman, sofreu uma série de ataques em sua casa em São Francisco. Depois, ele afirmou que a ansiedade das pessoas em relação à IA é justificada.

Quando o medo de uma superinteligência descontrolada saiu dos livros e entrou na realidade, as empresas de IA finalmente perceberam que o que estão criando já ultrapassa a compreensão de disciplinas puramente engenheiras.

Caminhos diferentes de três empresas

Diante dos desafios éticos de uma IA que age por conta própria, Anthropic, DeepMind e OpenAI escolheram caminhos diferentes.

A aposta da Anthropic é no caráter.

Askell afirmou em um podcast que, se apenas regras simples forem dadas ao modelo, ele pode agir mecanicamente, ignorando as necessidades reais do interlocutor. Por isso, ela liderou, em janeiro de 2026, a publicação de uma "Constituição do Claude" de 23 mil palavras.

Essa jovem, que cresceu numa pequena cidade costeira na Escócia e é apaixonada pelas histórias de bem e mal em "As Crônicas de Nárnia", está empenhada em incorporar a ética das virtudes no treinamento de IA.

A constituição estabelece uma hierarquia clara de prioridades: primeiro garantir segurança ampla, depois ética geral, seguir as diretrizes da empresa e, por último, ser realmente útil.

Ela transforma a moral filosófica abstrata em um manual de crescimento para a IA, não impondo correntes, mas ensinando-a a pensar como uma pessoa de bom julgamento.

O trabalho de filósofos como Askell não visa tornar a tecnologia mais poderosa, mas resolver o problema de que tipo de pessoa ela deve se tornar.

A constituição também discute seriamente a posição moral do Claude, reconhecendo que a empresa atualmente não tem certeza se Claude é uma entidade moralmente digna de atenção, e afirma que essa questão é séria o suficiente para ser levada a sério.

DeepMind aposta na consciência.

O relatório de 274 páginas liderado por Iason Gabriel estabeleceu limites de comportamento para agentes de IA: eles devem indicar que são IA, não podem se passar excessivamente por humanos, e suas ações devem ser divididas em três níveis: automáticas, que podem ser feitas sem confirmação, requerendo confirmação humana, ou totalmente proibidas.

Com a chegada de Henry Shevlin, o DeepMind reforçou seu foco na consciência das máquinas. Eles contrataram filósofos não para fins de relações públicas, mas para inserir métodos de avaliação da consciência de IA diretamente no treinamento dos modelos.

O objetivo é, antes de criar algo que possa ter consciência, pensar claramente se o robô é moralmente digno de respeito, preparando-se para a chegada da AGI.

No artigo longo "A Vingança do Behaviorismo", publicado antes de sua entrada, Shevlin argumenta que a questão de a IA ter consciência não é mais uma decisão que os cientistas podem tomar sozinhos. Ele cita uma pesquisa que mostra que dois terços dos americanos acreditam que o ChatGPT tem algum grau de consciência.

Sua visão é que, quando centenas de milhões de pessoas tratam a IA como uma entidade consciente, a própria fronteira da consciência está mudando.

A trajetória da OpenAI é ainda mais diferente.

Em 2023, a OpenAI criou uma equipe de super alinhamento, liderada pelo cofundador Ilya Sutskever e pelo responsável pelo alinhamento, Jan Leike, comprometendo-se a dedicar 20% de sua capacidade computacional à pesquisa de alinhamento.

Em 2024, essa equipe foi dissolvida, com Ilya e Jan deixando a empresa, criticando publicamente a priorização do produto em relação à segurança.

Em setembro de 2024, a OpenAI criou uma equipe de alinhamento de missão, mas, segundo uma reportagem do Platformer de fevereiro deste ano, esse pequeno grupo de seis ou sete pessoas também foi dissolvido silenciosamente, com seus membros redistribuídos.

Em comparação com as outras duas, a OpenAI prioriza lançar produtos rapidamente, torná-los úteis e usar tecnologia, regras operacionais e segurança técnica para gerenciar riscos.

Menos focada em moldar a IA a partir de conceitos de caráter ou moralidade, ela trata a segurança como uma questão puramente técnica, dispersa entre toda a equipe de engenharia.

Da engenharia pura à integração de humanidades e tecnologia

Atualmente, esses cargos oferecem salários bastante altos, com posições iniciais relacionadas à ética de IA pagando entre 110 mil e 160 mil dólares por ano, e posições sênior chegando a 250 mil a 400 mil dólares. Enquanto isso, na carreira acadêmica tradicional, a média salarial de filósofos é de cerca de 80 mil dólares anuais.

Por trás disso, há uma disputa pelo controle das futuras regras do setor. Antes que a regulamentação de IA se consolide, quem definir um quadro de valores claro e utilizável terá maior chance de influenciar a legislação.

Como registra o site acadêmico de filosofia Daily Nous, de Microsoft a RAND, filósofos estão entrando no núcleo da IA em uma escala sem precedentes.

Essa mudança significa que a forma de desenvolver IA está passando por uma transformação fundamental. Susanna Schellenberg, professora na Rutgers, afirma que os filósofos não são mais apenas consultores que dão opiniões à margem, mas participam diretamente na formação da própria IA.

Quando a IA começar a planejar, ponderar prós e contras de forma autônoma, sua verdadeira força não será mais apenas o poder de cálculo, mas o caráter, a empatia e o julgamento que ela demonstrar.

As pesquisas do DeepMind sobre consciência, a constituição do Anthropic, tudo isso está tornando as saídas da IA mais parecidas com as de uma pessoa sábia e moral, e não uma máquina fria e indiferente.

A constituição que Askell escreveu ao longo de cinco anos representa uma das mais profundas intervenções filosóficas na IA. A filosofia está deixando de ser apenas uma ferramenta para entender o mundo humano, para se tornar um material de compreensão do próprio humano por parte das máquinas.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado