Aqueles jovens de pequenas cidades que rotulam grandes modelos de IA

Autor do texto: Sleepy.md

Datong, na província de Shanxi — uma cidade que, no passado, sustentou metade do país graças ao carvão — hoje sacode a fuligem da sua existência e, munida de um malho mais afiado, volta-se para mais uma mina invisível e desfere um golpe pesado.

Num edifício de escritórios do Centro Internacional Jinmao, na zona urbana de Pingcheng, já não há poços de elevação, nem camiões de transporte de carvão. Em vez disso, há milhares de postos de trabalho de computador muito bem alinhados. A base de serviços de dados inteligentes do vale de Yunzhong, da Runxun (Xangai), ocupa várias divisões inteiras; milhares de jovens funcionários com auscultadores estão colados ao ecrã, clicando, arrastando, selecionando com quadros.

De acordo com dados oficiais, até novembro de 2025, a cidade de Datong já colocou em funcionamento 745 mil servidores, introduziu 69 empresas de chamada e anotação de dados, criando mais de 30 mil oportunidades de emprego local, a uma produção anual de 750 milhões de yuans. Neste fosso numérico, 94% de quem trabalha são registados como residentes locais.

Não é só Datong. Nas primeiras bases de anotação de dados definidas pelo órgão nacional de dados, surgem claramente no mapa cidades do interior do país, como Yonghe, em Shanxi, Bijie, na província de Guizhou, e Mengzi, na província de Yunnan. Na base de anotação de dados de Yonghe, 80% das funcionárias são mulheres. Muitas são mães da zona rural ou jovens regressados que não conseguem encontrar trabalho adequado.

Há cem anos, nas fábricas têxteis de Manchester, no Reino Unido, havia uma sala cheia de camponeses que perderam as terras. E hoje, à frente dos ecrãs de computador nessas cidades remotas do interior, estão sentados jovens que não encontram lugar na economia real.

Eles estão a fazer um tipo de trabalho por peça extremamente futurista, mas ao mesmo tempo totalmente primitivo, produzindo a ração de dados necessária para que gigantes da IA em Pequim, Xangai Shenzhen e no Vale do Silício treinem grandes modelos.

Ninguém acha que há qualquer problema.

A nova linha de produção no planalto do Loess

A essência da anotação de dados é ensinar as máquinas a reconhecerem o mundo.

A condução autónoma precisa de distinguir semáforos e peões; os grandes modelos precisam de perceber o que é um gato e o que é um cão. A máquina, por si, não tem bom senso; é preciso que os seres humanos, primeiro, desenhem um quadro numa imagem e lhe digam: «Isto é um peão». Só assim, depois de “engolir” dezenas de milhões de imagens, ela aprende a reconhecer sozinha.

Este trabalho não exige habilitações elevadas; só exige paciência e um dedo indicador capaz de clicar sem parar.

Na “época de ouro” de 2017, um simples quadro 2D custava mais de um cêntimo, chegando mesmo a haver empresas que ofereceram um preço alto de cinco cêntimos. Os anotadores com rapidez de dedos, a trabalhar um dia inteiro com algumas dezenas de horas, conseguiam ganhar cerca de 500 a 600 yuans. Nas cidades do interior, isso contava, sem dúvida, como um emprego bem pago e respeitável.

Mas, com a evolução dos grandes modelos, começou a revelar-se o lado cruel desta linha de produção.

Em 2023, o preço unitário da anotação simples de imagens tinha sido reduzido para apenas 3 a 4 fen (centésimos de yuans), uma queda superior a 90%. Mesmo na anotação de nuvens de pontos 3D — imagens compostas por pontos densos e que exigem um aumento inúmeras vezes para se verem os contornos — o anotador ainda tem de desenhar, num espaço tridimensional, um quadro sólido que inclua comprimento, largura, altura e o ângulo de rotação, para envolver com precisão perfeita o veículo ou o peão. E mesmo assim, aquele quadro 3D complexo tem apenas 5 fen.

A consequência direta de uma queda brutal do preço unitário é o aumento drástico da intensidade do trabalho. Para continuarem a agarrar-se aos parcos salários base de 2 a 3 mil yuans por mês, os anotadores têm de aumentar continuamente, sem parar, a sua velocidade de dedos.

Isto não é, de todo, um trabalho de escritório leve. Em muitas bases de anotação, a gestão é tão rigorosa que chega a sufocar: durante o trabalho não se permite atender chamadas, e o telemóvel tem de ficar trancado na gaveta de armazenamento. O sistema regista com precisão a trajetória do rato de cada funcionário e o tempo em que permanece parado. Se parar durante mais de três minutos, os alertas na retaguarda vêm como um chicote.

O que é ainda mais desesperante é a tolerância a erros. A linha de aprovação na indústria costuma estar acima de 95%; algumas empresas chegam a exigir 98% a 99%. Isto significa que, se fizer 100 quadros e errar apenas 2, a imagem inteira será devolvida para correcção.

Em animações, há frames consecutivos: os veículos que mudam de faixa ficam ocultados, e o anotador tem de os encontrar um a um recorrendo à inferência; nas nuvens de pontos 3D, basta que um objecto tenha mais de 10 pontos para exigir um quadro. Num projeto de parqueamento complexo, se a linha ficar comprida ou se houver quadros em falta, na fase de controlo de qualidade as falhas acabam sempre por ser descobertas. Uma imagem devolvida quatro ou cinco vezes é algo do dia-a-dia. No fim, depois de contar tudo, as horas de esforço resultam em apenas alguns fen.

Uma anotadora em Hunan publicou, numa plataforma social, o seu recibo de acerto: depois de um dia de trabalho, ela fez mais de 700 quadros, com um preço unitário de 4 fen, somando um rendimento total de 30,2 yuans.

É uma paisagem extremamente dividida.

De um lado, os “chefes” de tecnologia brilhantes e deslumbrantes em palcos de conferências, a falar sobre como a AGI irá libertar a humanidade; do outro, em cidades do interior no planalto do Loess e nas montanhas do sudoeste, jovens que encaram o ecrã oito a dez horas por dia, puxando quadros de forma mecânica — milhares, dezenas de milhares — e, até à noite, nos sonhos, com os dedos a desenhar linhas de faixa no ar.

Alguém já disse que a aparência da inteligência artificial é como um carro de luxo que passa a alta velocidade; mas ao abrir a porta, descobre-se que lá dentro há cem pessoas a pedalar bicicletas, a apertar os dentes e a esmagar os pedais com força.

Ninguém acha que há qualquer problema.

Trabalho por peça para ensinar a máquina “como amar”

Depois de a “barreira” do reconhecimento de imagens ter sido ultrapassada, os grandes modelos entraram numa evolução ainda mais profunda: precisam de aprender a pensar como os humanos, a conversar e até a demonstrar “empatia”.

Isso dá origem à etapa mais central e mais cara do treino de grandes modelos — RLHF (aprendizagem por reforço com feedback humano).

Em termos simples: pede-se que pessoas reais avaliem e pontuem as respostas geradas pela IA, indicando-lhe quais respostas são melhores e mais alinhadas com os valores humanos e as preferências emocionais.

A razão pela qual o ChatGPT parece “humano” é porque, por trás, há incontáveis anotadores RLHF a “darem-lhe aulas”.

Em plataformas de crowdsourcing, essas tarefas de anotação são muitas vezes anunciadas com preços explícitos: 3 a 7 yuans por peça. Os anotadores precisam de atribuir uma pontuação emocional extremamente subjetiva às respostas da IA, para julgar se a resposta é “calorosa”, se “tem empatia” e se “tem em conta as emoções do utilizador”.

Um trabalhador de base, que recebe mensalmente 2 a 3 mil yuans e corre para cima e para baixo na lama da realidade, sem tempo nem sequer para prestar atenção às suas próprias emoções, tem de desempenhar, no sistema, o papel de mentor emocional da IA e de juiz de valores.

Precisa de esmagar e triturar à força essas emoções humanas extremamente complexas e subtis — calor, empatia — e quantificá-las em notas frias de 1 a 5. Se a sua pontuação não coincidir com as respostas-padrão definidas pelo sistema, será considerada como não atingindo a taxa de acerto; a partir daí, será descontado o salário por peça, já por si muito magro.

É uma forma de esvaziamento cognitivo. As emoções humanas — complexas e delicadas —, a moral e a compaixão estão a ser arrastadas à força para um funil de algoritmos. Nas escalas frias da quantificação e da padronização, é como se lhes fosse espremido até ao último resquício de calor. Quando se fica impressionado com o facto de, no ecrã, o “monstro” cibernético já ter aprendido a escrever poemas e compor música, a tratar as pessoas com ternura e até a vestir uma máscara cheia de sentimento; mas do lado de fora do ecrã, aquela massa de humanos — que antes era viva — degradou-se em máquinas de pontuação sem emoções, num julgamento mecânico repetido dia após dia.

Esta é a faceta mais secreta de toda a cadeia industrial; nunca aparece em nenhuma notícia de financiamento nem em manuais técnicos e white papers.

Ninguém acha que há qualquer problema.

Mestres 985 e jovens das pequenas cidades

O trabalho de puxar quadros na base está a ser esmagado pelas esteiras da IA. Esta linha de produção cibernética começa a “propagar-se” para cima, a devorar trabalhos mentais de nível mais elevado.

O apetite dos grandes modelos mudou. Já não se contenta em “mastigar” senso comum simples; precisa de devorar conhecimentos profissionais humanos e lógica de nível avançado.

Nos vários portais de recrutamento, começam a aparecer com frequência certos tipos especiais de part-time, como “anotação lógica de grandes modelos” e “treinador de humanidades para IA”. As exigências para este part-time são muito elevadas: muitas vezes exigem “licenciatura de mestrado 985/211 ou superior” e envolvem áreas como direito, medicina, filosofia, literatura e outras disciplinas.

Muitos estudantes de pós-graduação de escolas de elite são atraídos e entram nestes grupos de outsourcing das grandes empresas. Mas depressa descobrem que não se trata de um “ginásio mental” leve; é uma tortura mental.

Antes de aceitarem encomendas oficiais, têm de ler documentos longos com dezenas de páginas sobre dimensões de pontuação e critérios de avaliação, e fazer duas a três rodadas de teste de anotação. Depois de conseguirem passar, durante a anotação oficial, se a taxa de acerto ficar abaixo da média, perdem a qualificação e são expulsos do grupo.

O que mais sufoca é que esses critérios nem sequer são fixos. Diante de problemas e respostas semelhantes, se se avaliar com o mesmo modo de pensamento, os resultados podem ser completamente opostos. É como fazer uma prova que nunca acaba e que, além disso, não tem uma resposta-padrão. Não é possível melhorar a taxa de acerto com esforço próprio ou aprendizagem; só é possível ficar a rodar no mesmo lugar, consumindo energia mental e física.

Esta é a nova exploração na era dos grandes modelos — a “dobra” das classes.

O conhecimento, que antes era visto como uma escada de ouro para romper barreiras e subir, acabou por se converter num tipo de “ração digital”, agora destinada a ser servida aos algoritmos e que é ainda mais complexa de “mastigar”. Diante do poder absoluto dos algoritmos e dos sistemas, os mestres 985 dos “castelos de marfim” e os jovens das pequenas cidades no planalto do Loess enfrentam um caminho misteriosamente semelhante, apesar de diferentes: ambos são levados pela mesma corrente.

Eles caem juntos neste poço cibernético sem fundo, perdem o brilho das suas credenciais, têm as diferenças aplainadas e acabam todos transformados em engrenagens baratas, substituíveis a qualquer momento, nas esteiras.

Lá fora é igual. Em 2024, a Apple cortou diretamente um grupo de anotação de voz de IA com 121 pessoas em Santiago. Esses funcionários eram responsáveis por melhorar a capacidade do Siri de processar várias línguas. Eles achavam que estavam na periferia da actividade central das grandes empresas, mas caíram instantaneamente no abismo do desemprego.

Na perspectiva dos gigantes tecnológicos, tanto as mães da cidade do interior que puxam quadros diante de computadores, como os treinadores lógicos formados em escolas de prestígio, são essencialmente “consumíveis” que podem ser substituídos a qualquer momento.

Ninguém acha que há qualquer problema.

Um Babela de biliões de biliões, construído com o suor de alguns cêntimos

Com base nos dados divulgados pela China Academy of Information and Communications Technology (CAICT), em 2023 o mercado chinês de anotação de dados tinha uma dimensão de 6,08 mil milhões de yuans; em 2025, prevê-se 20 a 30 mil milhões de yuans. E, segundo as previsões, até 2030, as vendas do mercado global de anotação e serviços de dados dispararão até aos 117,1 mil milhões de yuans.

Por trás desses números, há uma festa de avaliação — OpenAI, Microsoft, ByteDance e outros gigantes tecnológicos — que vão de “centenas de milhares de milhões” a “trilhões” de dólares em valor.

Mas esta riqueza toda, que parece cair do céu, não fluiu para aqueles que, na verdade, “alimentam” a IA.

A indústria chinesa de anotação de dados mostra uma estrutura típica de subcontratação em forma de pirâmide invertida. No topo estão os gigantes tecnológicos, que agarram com força os algoritmos centrais; na segunda camada estão os grandes fornecedores de serviços de dados; na terceira, estão as bases de anotação espalhadas por todo o país e as empresas de subcontratação de pequena e média dimensão; e só na base estão os anotadores “pé-descalços” que recebem salário por peça.

Em cada camada de outsourcing, é sempre “arrancada” uma camada grossa de gordura. Quando o preço unitário lançado pelas grandes empresas é de 5 fen, depois de todas as sucessivas espoliações, o que fica nas mãos do anotador de uma cidade do interior pode ser até inferior a 5 fen.

O ex-ministro das Finanças da Grécia, Yanis Varoufakis, no seu livro “Technological Feudalism”, lançou uma perspetiva com grande capacidade de penetração: hoje, os gigantes tecnológicos já não são capitalistas no sentido tradicional; são “cloudalists” (senhores da nuvem).

O que eles possuem não são fábricas e máquinas, mas sim algoritmos, plataformas e capacidade de computação — territórios digitais da era cibernética. Neste novo sistema feudal, o utilizador não é um consumidor, mas sim um rendeiro digital; e cada like, comentário e visualização nas redes sociais que fazemos, está a servir gratuitamente os dados aos “senhores da nuvem”.

E aqueles anotadores de dados distribuídos pelos mercados de “capilaridade”, são a camada mais baixa de “servos digitais” deste sistema. Eles não têm apenas de produzir dados: também precisam de limpar, classificar e pontuar enormes volumes de dados brutos, transformando-os em ração de alta qualidade que os grandes modelos conseguem “digerir”.

É um movimento secreto de ocupação de terreno cognitiva. Tal como, no século XIX, o movimento de cercamento no Reino Unido empurrou os camponeses para dentro das fábricas têxteis, hoje, a vaga de IA empurra os jovens que não encontram lugar na economia real para a frente dos ecrãs.

A IA não apagou a clivagem entre classes; antes, construiu uma “cinta transportadora de dados e suor” que vai das cidades do interior centro-oeste da China até às sedes dos gigantes tecnológicos de Pequim, Xangai, Shenzhen e Cantão. A narrativa das revoluções tecnológicas é sempre grandiosa e brilhante, mas o seu fundo, para sempre, é o consumo em massa de mão de obra barata.

Ninguém acha que há qualquer problema.

Amanhã que já não precisa de humanos

O desfecho mais cruel está a chegar — e cada vez mais depressa.

Com os saltos de capacidade dos grandes modelos, aquelas tarefas de anotação que antes exigiam trabalho dia e noite de humanos estão a ser assumidas pela própria IA.

Em abril de 2023, Li Xiang, fundador da Li Auto, revelou em fórum dados: no passado, a Li Auto precisava de fazer aproximadamente 10 milhões de frames de calibração manual de imagens para condução autónoma por ano; o custo de outsourcing aproximava-se de um bilhão. Mas, quando passaram a usar grandes modelos para automatizar a anotação, as coisas que antes demoravam um ano podiam ser concluídas, na prática, em apenas 3 horas.

A eficiência é 1000 vezes a do ser humano — e já em 2023. Nos primeiros meses que acabaram de passar, em março, a Li Auto lançou também o novo motor de anotação automática MindVLA-o1.

Na indústria circula uma frase de autodepreciação absolutamente verdadeira: “quanto mais inteligência, mais mão de obra”. Mas agora, no investimento das grandes empresas em outsourcing de anotação de dados, já surgiu uma descida abrupta de 40% a 50%.

Aqueles jovens das pequenas cidades que ficaram incontáveis noites diante

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar