Eu vendo meus vídeos de tarefas domésticas para treinar IA de robôs, com uma taxa horária de 6,6 dólares, abaixo do salário mínimo

Wired repórter Reece Rogers prendeu o iPhone na testa, passou uma semana gravando vídeos em primeira pessoa fazendo tarefas domésticas, e enviou para a plataforma de coleta de dados Luel, para treinar robôs humanoides.
(Preâmbulo: O prospecto do robô humanoide revela: o primeiro envio global de robôs humanoides, comercialização apoiada por instituições de pesquisa escolares)
(Informação adicional: Abrir a boca para fazer o robô lavar louça e limpar? A Figure lança o modelo de IA "Helix" visando a revolução nas tarefas domésticas)

6,6 dólares, abaixo do salário mínimo federal dos EUA de 7,25 dólares. Este é o valor por hora que Rogers, do Wired, conseguiu ao passar uma semana com o iPhone preso na testa, gravando sua perspectiva ao fazer tarefas domésticas em casa.

O empregador é uma plataforma de coleta de dados chamada Luel. Cada movimento dele — cortar pepino, servir bebidas, colocar pratos na lava-louças — é registrado, empacotado e vendido para empresas de IA que treinam robôs humanoides.

Rogers sabe bem que pode estar treinando algo que, cedo ou tarde, substituirá os humanos. Ele descreve na reportagem que todo o processo foi embaraçoso e monótono.

Especificações de gravação rigorosas a ponto de serem absurdas

Segundo Rogers, as exigências técnicas da Luel são muito rígidas: o dispositivo de gravação deve ser preso na cabeça, sem permitir o uso das mãos; o ângulo deve ser de grande angular horizontal; a resolução deve ser de pelo menos 1080p. A regra mais importante: as mãos devem aparecer na tela por mais de 95% do tempo.

Seu primeiro vídeo de 5 minutos foi rejeitado pela plataforma, por não mostrar as mãos suficientemente visíveis na câmera. Depois, ele ajustou a forma de gravar, repetindo o mesmo movimento: amarrar cadarços — fez isso 20 vezes. Preparar salada, lavar pratos, cortar pepino — cada ação exigia que as mãos permanecessem na posição principal na câmera.

Esse tipo de vídeo é conhecido na indústria como "dados de perspectiva em primeira pessoa". Simplificando, é colocar a câmera na altura dos olhos da pessoa, para que o robô observe o mundo físico a partir da "visão humana": como as mãos se aproximam dos objetos, como os dedos aplicam força, como o olhar se move após completar uma ação.

Descrições em texto não conseguem transmitir essas informações; apenas vídeos contínuos em primeira pessoa permitem que o robô compreenda como os movimentos acontecem.

Isso explica por que as exigências da plataforma são tão precisas: as mãos precisam estar visíveis por 95% do tempo, não por estética, mas porque o modelo de robô precisa extrair a sequência completa de movimentos das mãos a partir do vídeo. Se as mãos desaparecem, o valor do vídeo para o treinamento diminui drasticamente.

Precificação de mercado dos dados

A Luel paga 6,6 dólares por hora, cobrando cerca de 1 a 2 dólares por vídeo. Esse valor é considerado baixo no mercado de trabalhos temporários, mas não é a única referência.

Plataformas maiores oferecem condições muito melhores. Rogers menciona na reportagem que empresas como a DoorDash pagam cerca de 20 dólares por hora por vídeos semelhantes, mais de três vezes o valor da Luel. A diferença reflete a urgência de diferentes compradores por esses dados: quanto mais próximo da fase de produção em massa de robôs comerciais, maior o valor que estão dispostos a pagar por esses dados.

O preço baixo da Luel tem uma estrutura por trás. Os dados coletados não são usados internamente, mas revendidos como intermediária para empresas de robótica e IA. Nesse ciclo, os trabalhadores que fornecem os vídeos recebem a menor parte do valor, enquanto os compradores finais pagam taxas de licenciamento que podem ser várias ordens de magnitude maiores. Rogers não registra apenas seu próprio valor por hora, mas também como um mercado emergente de dados está definindo o preço da força de trabalho.

Esses trabalhos estão dispersos em várias plataformas, sem uma padronização de preços ou proteção trabalhista. Os 6,6 dólares estão abaixo do salário mínimo federal, mas isso não é ilegal, pois esse valor é considerado "renda de venda de vídeos", e não "salário".

O que é irônico é que, no futuro, alguns robôs que te substituem podem ser treinados por você mesmo, e o valor que você recebe por isso é inferior ao salário mínimo legal…

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado