Relatório da Anthropic responde à autoevolução: já testou o ciclo fechado parcial, mas ainda há distância para um treinamento totalmente autônomo

robot
Geração do resumo em andamento
De acordo com o monitoramento Beating, a capacidade de iteração autônoma da IA está superando todas as expectativas. O Instituto Anthropic publicou em 5 de junho o relatório "Quando a IA constrói a si mesma", detalhando seus avanços no campo de "autoaperfeiçoamento recursivo". Os dados indicam que, até maio de 2026, mais de 80% do código mesclado no repositório principal da Anthropic foi escrito pelo próprio Claude. Antes do lançamento do Claude Code em fevereiro de 2025, o código escrito por Claude representava apenas uma porcentagem de dígitos. Jang Jie, fundador da Zhipu AI, previu em 13 de maio que o fim do grande modelo seria a autoevolução, e que Claude já teria passado pela linha de base de auto-treinamento de "escrever código, limpar dados e treinar a si mesmo". No entanto, o relatório da Anthropic esclarece que a autoaperfeiçoamento recursivo totalmente autônomo, com design e desenvolvimento de sucessores, ainda não foi realizado. O papel da IA na cadeia de desenvolvimento está passando de uma fase de eficiência local para uma de decisão autônoma. No segundo trimestre de 2026, a quantidade de código mesclado por engenheiro por dia na Anthropic atingiu 8 vezes o valor de 2024. O processo de desenvolvimento atual é simples: os engenheiros apenas planejam objetivos e revisam, enquanto Claude é responsável pela codificação e execução específicas. A Anthropic também implantou Claude como avaliador automático de código, responsável por interceptar bugs e vulnerabilidades de segurança. Isso indica que o pilar de "autoavaliação" apontado por Jang Jie já foi implementado na engenharia, mas a revisão humana ainda é a última linha de defesa. A confiabilidade na execução independente de tarefas de longo prazo pelos modelos também dobrou. O tempo que o modelo pode trabalhar de forma autônoma continua aproximadamente a dobrar a cada 4 meses. Em março de 2024, o Claude 3 Opus só podia lidar com tarefas simples de 4 minutos. Um ano depois, o Claude 3.7 Sonnet consegue suportar 1,5 hora. Em março de 2026, o Claude 4.6 Opus já consegue lidar com tarefas complexas de 12 horas. Dados do órgão de avaliação METR mostram que a versão de pré-visualização do Claude Mythos mais recente pode trabalhar de forma autônoma por mais de 16 horas, chegando perto do limite das ferramentas de avaliação atuais. Com a velocidade atual, até 2027, a IA será capaz de realizar autonomamente tarefas de pesquisa que levariam semanas humanas, ajudando empresas a passar de uma "empresa individual" para uma "empresa sem pessoas". Quanto à hipótese de Jang Jie sobre a "linha de base de auto-treinamento", o relatório revela na verdade um "ciclo de experimento em miniatura" parcial. Nos experimentos de aceleração de código de modelos pequenos, em maio de 2025, o Claude 4 Opus conseguiu aumentar a velocidade do código em 3 vezes, enquanto a pré-visualização do Claude Mythos em abril de 2026 atingiu uma aceleração de 52 vezes. Em comparação, os principais pesquisadores humanos geralmente conseguem um aumento de 4 vezes em 4 a 8 horas. No entanto, os objetivos de otimização e os critérios de sucesso do experimento foram definidos previamente por humanos. Quando confrontada com uma cadeia completa de "limpeza de dados, geração de dados sintéticos e auto-treinamento", a capacidade de decisão da IA ainda é insuficiente. No entanto, o ciclo autônomo de desenvolvimento está levando os humanos ao limite de perder o controle final do sistema. A previsão de Jang Jie de que "LLM OS substituirá arquiteturas tradicionais e aplicações serão geradas sob demanda em tempo real" significa que, no futuro, os computadores executarão códigos dinâmicos impossíveis de serem revisados antecipadamente; enquanto o alerta da Anthropic de que "a revisão humana não acompanhará a autoevolução da IA" implica que nem mesmo a origem da geração de código pode ser controlada. Quando a IA começar a projetar e treinar sucessores de forma autônoma, a evolução do software se tornará um sistema de caixa preta. Se permitir que a IA realize auto-iterações não auditadas por humanos dentro de um sistema de caixa preta, o isolamento de segurança, monitoramento e alinhamento de comportamento dessas melhorias subsequentes se tornarão extremamente difíceis.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado