Só sabe Vibe Coding, não se torna especialista! Anthropic revela a verdade: conhecimento especializado é mais importante do que escrever código

Relatório aponta que, ao usar inteligência artificial para programar, o conhecimento de domínio e a capacidade de validação são mais importantes do que as habilidades de programação. Possuir julgamento profissional e habilidade de formular questões pode aumentar significativamente a taxa de sucesso das tarefas.

16 de junho, a Anthropic publicou o relatório de pesquisa 《Agentic coding and persistent returns to expertise》 (agentic coding refere-se a "programação delegada", você dá a instrução, a IA lê os arquivos e executa as tarefas).

O relatório analisa cerca de 235 mil usuários e aproximadamente 400 mil interações com Claude Code entre outubro de 2025 e abril de 2026, tentando responder a uma questão que preocupa muitas pessoas: pessoas sem treinamento formal em programação podem realmente comandar a IA para realizar trabalhos técnicos complexos?

A resposta do relatório é afirmativa, mas o que realmente merece atenção é a conclusão: talvez não seja tão importante saber programar, e sim entender profundamente a questão em mãos.

"Todo mundo pode programar", essa frase só está parcialmente correta

No último ano, o "vibe coding" (programar por feeling, descrevendo em linguagem natural o que deseja, e a IA gera o código executável sem que você precise entender cada linha) se popularizou entre os desenvolvedores. Seguindo essa tendência, a narrativa mais comum é: a barreira para programar foi derrubada, todo mundo é engenheiro.

Quem se beneficia mais dessa narrativa? Fabricantes de ferramentas de IA, e empresários que pensam em dispensar engenheiros. Mas os dados do relatório ajustam essa visão para uma versão mais pragmática.

A Anthropic avalia cada usuário em cada conversa, atribuindo uma classificação de nível de "iniciante a especialista" com base na transcrição. É importante notar que esse nível de especialização não está relacionado ao cargo ou à inteligência da pessoa, mas sim à tarefa específica.

O relatório cita um exemplo crucial: um contador que nunca usou Python, mas que consegue explicar claramente as regras de conciliação e identificar erros de margem que a IA possa ter deixado passar na liquidação mensal, é considerado um especialista nessa tarefa; por outro lado, um engenheiro experiente que faz sua primeira pergunta sobre Rust é considerado um iniciante.

Em outras palavras, o "domínio" aqui não é sobre saber programar, mas sobre quanto você entende do problema que quer resolver. Por isso, reduzir o relatório à ideia de que "todo mundo pode substituir engenheiros" é um equívoco: o conhecimento de domínio é uma forma de julgamento profissional que exige anos de experiência, e não desapareceu, apenas mudou de posição, tornando-se uma possível barreira.

Como funciona a divisão de tarefas: você formula a questão, a IA responde

A imagem mais clara do relatório mostra a divisão de decisão entre humanos e IA. A Anthropic divide cada decisão em "planejamento" (o que fazer, qual método usar, como saber que terminou) e "execução" (alterar qual arquivo, escrever qual código, usar qual linguagem). Como resultado: em média, o humano realiza cerca de 70% do planejamento, enquanto Claude executa aproximadamente 80% das tarefas de implementação.

Fonte: Anthropic

Em linguagem simples, o humano é responsável por formular as perguntas e validar as respostas, enquanto a IA executa as tarefas. Além disso, quanto mais experiente o usuário, maior a tendência de "soltar" essa divisão: o relatório revela que, para iniciantes, cada comando dispara cerca de 5 ações da IA e gera cerca de 600 palavras; para especialistas, cada comando dispara cerca de 12 ações e produz aproximadamente 3.200 palavras. Pessoas mais experientes se sentem mais confiantes para delegar tarefas maiores, pois sabem como descrever e validar.

Fonte: Anthropic

Este é o primeiro ponto contraintuitivo do relatório: quanto mais forte a IA, maior o efeito de alavancagem dos profissionais experientes, ao invés de diminuir.

Os números que realmente fazem a diferença estão na taxa de sucesso

A Anthropic mede o sucesso da conversa de duas formas: a mais permissiva é "pelo menos parcialmente bem-sucedida"; a mais rigorosa é o "sucesso verificado" (que significa que, além da IA julgar que a tarefa foi concluída, há evidências concretas como commits no git, testes passando ou validação explícita do usuário).

Segundo o padrão mais rigoroso, a taxa de sucesso verificado para iniciantes é de apenas 15%, enquanto para intermediários e especialistas sobe para 28% a 33%. No padrão mais permissivo, iniciantes alcançam 77%, e intermediários e avançados, entre 91% e 92%.

Fonte: Anthropic

Mas há um detalhe importante: o relatório enfatiza que a maior parte do ganho ocorre na transição de "iniciante para intermediário"; além disso, a curva de melhora ao passar de intermediário para especialista é relativamente plana. Em palavras do próprio relatório, basta ter uma compreensão básica de um domínio e ser capaz de colocar a mão na massa para obter a maior parte dos benefícios; a profundidade de conhecimento adicional traz ganhos menores.

A diferença também se manifesta na resistência ao problema: quando a conversa encontra dificuldades (erros, testes falhando, tentativas repetidas), 19% dos iniciantes desistem sem escrever uma linha de código, enquanto essa taxa cai para 5-7% entre os demais níveis. O relatório interpreta isso como uma habilidade profissional: a capacidade de guiar a IA de volta ao caminho certo.

Uma descoberta subestimada: a diferença de desempenho entre profissões é menor do que se imagina

Se a experiência em programação fosse realmente tão decisiva, engenheiros de software deveriam liderar por uma larga margem. Mas os dados mostram o contrário.

Nas conversas que geram código, a taxa de sucesso verificado de profissionais de TI é de cerca de 34%, enquanto de outras profissões é de aproximadamente 29%, uma diferença de apenas 5 pontos percentuais, sem mudança significativa ao longo de sete meses.

O relatório analisou as dez principais profissões na base de dados, e cada uma delas apresenta uma taxa de sucesso dentro de 7 pontos percentuais da de engenheiros de software. Ainda mais surpreendente, gestores têm uma taxa de sucesso verificado ligeiramente superior à dos engenheiros.

O relatório sugere duas possíveis explicações: primeiro, que as habilidades de "comando, delegação e definição de tarefas" de gestores podem ser transferidas para a direção da IA; segundo, que a métrica de sucesso verificado pode estar enviesada, pois depende de o usuário explicitamente confirmar "é isso mesmo", algo que gestores podem fazer com mais facilidade.

Nos sete meses, uma mudança relevante foi a redução do tempo dedicado a depuração (debugging, encontrar e corrigir erros) de 33% para 19%, quase pela metade; ao mesmo tempo, o tempo dedicado à operação de software (implantação, configuração, execução) aumentou de 14% para 21%, enquanto a escrita de código e análise de dados dobrou de cerca de 10% para aproximadamente 20%.

O relatório estima, com base na comparação com o mercado de freelancing, que o valor médio de cada tarefa aumentou cerca de 27% nesse período (o resumo do relatório menciona aproximadamente 25%).

O que o relatório não diz, mas deveria

O relatório reconhece suas limitações: não consegue acompanhar os resultados no mundo real, ou seja, não sabe se o código gerado foi realmente utilizado posteriormente; também exclui usos "não interativos" (como integrar Claude Code em processos automáticos), que representam uma parte significativa. Todas as classificações são feitas com base na leitura da transcrição, portanto, trata-se de uma "fotografia inicial", não uma conclusão definitiva.

Mais importante para profissionais do conhecimento é a questão que o relatório deixa no final: a Anthropic afirma que continuará monitorando uma questão central: se o "retorno do conhecimento de domínio" começar a diminuir, isso indicará que o modelo está começando a fornecer por si só o julgamento que antes dependia do usuário.

A lição que fica é: você não precisa se preocupar em aprender a programar só porque não sabe; um investimento mais inteligente é aprofundar seu conhecimento na área em que atua, e tornar mais claro o que significa "estar certo".

Primeiro, defina bem o problema, depois deixe a IA acelerar; primeiro valide, depois solte a mão.

  • Este artigo foi reproduzido com autorização de: 《Digital Age》
  • Título original: 《Não basta saber programar! Anthropic revela a verdade do Vibe coding: mais importante que programar, é o conhecimento do seu campo de atuação》
  • Autor original: Li Xiantai
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado