Renascimento da IA» Filósofos tornam-se artigos cobiçados em laboratórios de IA, escrevendo ética no seu modelo.

Quando perguntas ao Claude se deves ou não fazer algo, já há alguém que pensou na resposta, e essa pessoa pode ser um filósofo. A Anthropic e a OpenAI estão a codificar à força duas estruturas éticas — deontologia e consequencialismo — nas regras de conduta da IA.

(Contexto anterior: Desde sair da OpenAI até enfrentar o Pentágono: como os irmãos da Anthropic traçaram a linha vermelha para a IA, evitando o colapso da civilização)

(Contexto adicional: Teste real do jogo de battle royale OpenRouter: Grok reina, os bons hábitos do Claude tornam-se a sua ruína)

Índice

Alternar

  • As duas filosofias por detrás das regras

  • Porquê filósofos?

  • Números são apenas uma fração, e as posições podem não ser neutras

Pergunta a mesma questão difícil ao Claude e ao ChatGPT, e as respostas podem ser completamente diferentes. Isto não é um viés nos dados de treino, nem ruído aleatório, mas sim porque dois quadros filosóficos opostos estão a ser escritos nos códigos de conduta de cada empresa de IA. O modelo que usas é, na verdade, o produto de uma certa posição ética.

As duas filosofias por detrás das regras

"A Constituição da IA" (em linguagem simples, o conjunto de regras que restringe as respostas e ações do modelo) não é uma tática de marketing de startups, mas uma tentativa de transformar ética abstrata em instruções executáveis pelo sistema. O problema é que a própria ética tem divergências fundamentais.

Deontologia (deontology, simplesmente "há coisas que nunca se pode fazer"): independentemente de quão boas sejam as consequências, mentir, coagir ou tratar pessoas como instrumentos são linhas vermelhas intransponíveis.

Consequencialismo (consequentialism, em linguagem simples "faz-se o balanço, se os benefícios superam os danos, pode-se fazer"): mede custos e benefícios, desde que o benefício esperado exceda o risco previsível, a ação é justificada.

O Claude da Anthropic segue mais a linha deontológica, sendo mais consistente e com menos exceções em diferentes contextos como família ou espaço público; o ChatGPT e o Google Gemini são mais próximos do consequencialismo, tendendo a avaliar riscos e benefícios caso a caso.

Esta diferença não é acidental. A equipa que redigiu a "Constituição" da Anthropic incluiu explicitamente os filósofos Amanda Askell e Joe Carlsmith, trazendo a formação filosófica para o núcleo do alinhamento do modelo. Isto é uma tensão real: perante o mesmo pedido, um sistema deontológico pode simplesmente recusar, enquanto um sistema consequencialista pode primeiro perguntar "quem beneficia no final?"

Porquê filósofos?

Há dez anos, os alunos de humanidades ouviam frequentemente dos professores "aprende programação para ter futuro"; agora são os engenheiros a preocupar-se: será que a IA vai tornar as suas competências obsoletas?

A Anthropic, Google DeepMind e Meta têm recrutado ativamente investigadores de filosofia, ética e ciência cognitiva nos últimos anos, e isto não é apenas uma jogada de relações públicas. A IA está a tocar num conjunto de problemas sem solução técnica única: consciência, agência, atribuição de responsabilidade, governança de segurança, juízos de valor. Sam Altman afirmou publicamente que a OpenAI consultou "centenas de filósofos morais" ao definir as regras do ChatGPT. Quer este número seja preciso ou não, a direção por si só já diz muito.

A Anthropic e a Google DeepMind foram ainda mais longe, investindo em investigação sobre o "bem-estar da IA", explorando se os modelos têm estados internos semelhantes a sentimentos. Esta investigação corre em paralelo com a busca pelo AGI: se a IA realmente se aproximar da consciência humana, a compreensão dos filósofos sobre consciência, subjetividade e linguagem deixa de ser apenas um adorno humanista e torna-se uma perspetiva que os engenheiros não têm.

Na comunidade de developers Hacker News, há também observações construtivas: fornecer o propósito, a justificação e o contexto de compromisso ao LLM torna os resultados mais fiáveis do que instruções puramente imperativas. Isto pode ser exatamente o que a formação filosófica faz habitualmente: primeiro esclarecer "que problema se quer resolver", depois perguntar "se, através de testes, realmente cumpre o propósito".

Claro, há quem refute que isto se assemelha mais à clarificação de requisitos de produto, não podendo ser diretamente equiparado à argumentação rigorosa da filosofia académica.

Números são apenas uma fração, e as posições podem não ser neutras

Claro, descrever esta tendência como "filósofos a invadir a indústria tecnológica" é, em si, um exagero. Na realidade, os cargos de filósofos em toda a indústria tecnológica ainda são escassos, muito menos de 1% dos engenheiros.

E o problema mais fundamental não está nos números, mas na estrutura: será que os filósofos empregados conseguem realmente desafiar as decisões comerciais dos empregadores? As equipas de ética de IA nas empresas tecnológicas deixaram um precedente histórico: quando as conclusões da investigação entram em conflito com os interesses comerciais, esses cargos são frequentemente os primeiros a desaparecer.

Isto não é apenas um problema de governança empresarial, mas também envolve o risco do próprio quadro filosófico. O consequencialismo parece racional e quantificável, mas quando aplicado ao desenvolvimento de armas, decisões políticas ou sistemas de grande escala, a imprevisibilidade das consequências faz com que o cálculo de "benefícios superam danos" saia rapidamente do controlo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado