Relatório da Anthropic responde à autoevolução: já testou um ciclo fechado parcial, mas ainda há distância de um treino totalmente autônomo

robot
Geração de resumo em curso
De acordo com o monitoramento Beating, a capacidade de iteração autônoma da IA está superando todas as expectativas. O Instituto Anthropic publicou em 5 de junho o relatório "Quando a IA constrói a si mesma", detalhando seus avanços no campo de "autoaperfeiçoamento recursivo". Os dados indicam que, até maio de 2026, mais de 80% do código mesclado no repositório principal da Anthropic foi escrito pelo próprio Claude. Antes do lançamento do Claude Code em fevereiro de 2025, o código escrito por Claude representava apenas uma porcentagem de dígitos. Jang Jie, fundador da Zhizhuo AI, previu em 13 de maio que o fim do grande modelo seria a autoevolução, e que Claude já teria implementado a linha de base de auto-treinamento de "escrever código, limpar dados, treinar a si mesmo". No entanto, o relatório da Anthropic esclarece que a autoaperfeiçoamento recursivo totalmente autônomo, com design e desenvolvimento de sucessores, ainda não foi alcançado. O papel da IA na cadeia de desenvolvimento está passando de uma fase de aumento de eficiência local para uma de decisão autônoma. No segundo trimestre de 2026, a quantidade de código mesclado por engenheiro por dia na Anthropic atingiu 8 vezes o valor de 2024. O processo de desenvolvimento atual é simples: os engenheiros apenas planejam objetivos e revisam, enquanto Claude é responsável pela codificação e execução específicas. A Anthropic também implantou Claude como revisor automático de código, responsável por interceptar bugs e vulnerabilidades de segurança. Isso indica que o pilar de "autoavaliação" apontado por Jang Jie já foi implementado na engenharia, mas a revisão humana ainda é a última linha de segurança. A confiabilidade na execução independente de tarefas de longo prazo pelos modelos também dobrou. O tempo que o modelo consegue trabalhar de forma autônoma aumenta aproximadamente a cada 4 meses. Em março de 2024, o Claude 3 Opus só podia lidar com tarefas simples de 4 minutos. Um ano depois, o Claude 3.7 Sonnet consegue suportar 1,5 hora. Em março de 2026, o Claude 4.6 Opus já consegue enfrentar tarefas complexas de 12 horas. Dados do órgão de avaliação METR mostram que a versão de pré-visualização do Claude Mythos mais recente consegue trabalhar de forma autônoma por mais de 16 horas, chegando perto do limite das ferramentas de avaliação atuais. Com o ritmo atual, até 2027, a IA será capaz de realizar autonomamente tarefas de pesquisa que levariam semanas humanas, ajudando empresas a fazer a transição de "empresa individual" para "empresa sem pessoas". Quanto à hipótese de Jang Jie sobre a "linha de base de auto-treinamento", o relatório revela na verdade um "ciclo de experimento em miniatura" parcial. Nos experimentos de aceleração do código de treinamento de modelos pequenos, em maio de 2025, o Claude 4 Opus conseguiu acelerar o código em 3 vezes, enquanto em abril de 2026, a pré-visualização do Claude Mythos atingiu uma aceleração de 52 vezes. Em comparação, os principais pesquisadores humanos geralmente conseguem um aumento de 4 vezes em 4 a 8 horas. No entanto, os objetivos de otimização e os critérios de sucesso do experimento foram definidos previamente por humanos. Quando confrontados com uma cadeia completa de "limpeza de dados, geração de dados sintéticos e auto-treinamento", a capacidade de decisão da IA ainda é insuficiente. No entanto, o ciclo de fechamento autônomo da cadeia de pesquisa e desenvolvimento está empurrando a humanidade para a beira de perder o controle final do sistema. A previsão de Jang Jie de que "o LLM OS substituirá arquiteturas tradicionais e aplicações serão geradas sob demanda em tempo real" significa que, no futuro, o funcionamento dos computadores será baseado em códigos dinâmicos impossíveis de serem revisados antecipadamente; enquanto o alerta da Anthropic de que "a revisão humana não acompanhará a autoevolução da IA" implica que nem mesmo a origem da geração de código poderá ser controlada. Quando a IA começar a projetar e treinar sucessores de forma autônoma, a evolução do software se tornará um caixa-preta completa. Se permitir que a IA realize auto-iterações sem auditoria humana dentro de um sistema de caixa-preta, o isolamento de segurança, monitoramento e alinhamento de comportamento do sistema de autoaperfeiçoamento se tornarão extremamente difíceis.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado