Mobilizar as massas para participar, a JD.com visa ao "cultivo de elixir" de dados encorpados

SnapshotLaborer · 2026-03-18T08:06:15+00:00

16 de Março, um comunicado da JD.com sobre a construção do maior centro global de coleta de dados de inteligência incorporada e o cenário mais completo, marcou o rastreamento de robôs que havia sido ofuscado pelas lagostas e permanecido silencioso por algum tempo com uma nota pesada.De certa forma, trata-se de um movimento de grande produção de dados com forte coloração de internet industrial.Este apelo de mobilização abrange mais de 100 mil funcionários internos, até 500 mil pessoal de várias indústrias externamente, e até mobilizou mais de 100 mil cidadãos apenas em Suqian——esta tática de guerra de desgaste sem precedentes, tentando usar a estética brutal da escala para forçar a penetração da lesão mais mortal da inteligência incorporada atual: escassez de dados.Ao mesmo tempo em que a arquitetura de modelos está gradualmente convergindo e o limite de poder computacional é relativamente transparente, dados de interação física de alta qualidade tornaram-se o único fator decisivo que determina se os robôs podem realmente expandir para centenas de indústrias.Por trás desta ação definida como "a maior ação de coleta de dados na história da humanidade", revela um consenso industrial: quando a inteligência incorporada é responsável pelo movimento

SnapshotLaborer

2026-03-18 08:06:15

16 de março, a divulgação da JD.com sobre a construção do maior centro de coleta de dados de inteligência incorporada do mundo, com o cenário mais completo, lançou um peso na pista de robótica, que havia ficado em silêncio após ser ofuscada por notícias sobre lagostas.

Por certo, trata-se de uma grande operação de produção de dados com forte conotação de internet industrial.

Este movimento envolve mais de 100 mil funcionários internos, até 500 mil profissionais de diversos setores externos, e até mais de 100 mil cidadãos em Suqian — uma tática sem precedentes de multidão, tentando usar uma estética de violência em escala para romper a mais grave fraqueza da inteligência incorporada: a escassez de dados.

Hoje, com a arquitetura de modelos cada vez mais consolidada e as barreiras de computação mais transparentes, dados de alta qualidade de interação física tornaram-se o fator decisivo para que robôs possam realmente se integrar em diversos setores.

Por trás desta ação, considerada a maior coleta de dados da história da humanidade, revela-se um consenso industrial: quando o “pequeno cérebro” responsável pelo controle de movimento da inteligência incorporada se desenvolve, a batalha central é como alimentar um cérebro que compreenda verdadeiramente o mundo físico com dados de maior qualidade, determinando o futuro do setor.

Da narrativa grandiosa da JD para a realidade microindustrial, ainda é difícil determinar se os dados gerados por dezenas de milhares de pessoas são um tesouro ou apenas areia.

Envolvimento dos trabalhadores

A coragem e a necessidade da JD de lançar essa batalha de multidão de dados baseiam-se na sua vasta e altamente complexa cadeia de suprimentos própria.

Ao contrário de empresas de internet puramente de software, a JD é uma interação com o mundo físico, e a maturidade da inteligência incorporada afeta diretamente seus custos de cumprimento e eficiência operacional nos próximos dez anos.

Essa estratégia está profundamente ligada ao ecossistema de robótica do Beijing Yizhuang.

A Zona de Desenvolvimento Econômico e Tecnológico de Yizhuang já reúne mais de 300 empresas relacionadas a robótica, com uma cadeia de valor que supera 10 bilhões de yuans, oferecendo mais de 40 cenários de aplicação real, tornando-se o núcleo da indústria de robôs humanoides no país. Como uma das principais empresas enraizadas em Yizhuang, a JD já lançou planos acelerados para a indústria de robótica.

O investimento maciço em centros de coleta de dados e infraestrutura de software representa, na verdade, o preenchimento de uma lacuna na cadeia industrial. Yizhuang fornece “tronco” e áreas de teste, enquanto a JD tenta usar cenários massivos para infundir conhecimento de mundo real nos robôs.

Essa ressonância entre hardware e software busca criar um ciclo de negócios que vai do dado ao hardware, fechando um ciclo de inovação.

A coordenação de dezenas de milhares de pessoas não é tarefa fácil.

Segundo o planejamento, os cenários de coleta abrangem logística, indústria, varejo, entre outros. Na prática, provavelmente dependerá da rede de gestão digital já existente na JD. Por exemplo, entregadores e operadores de armazém podem usar dispositivos vestíveis com sensores visuais e até de força para suas tarefas diárias.

Para os funcionários de linha de frente e cidadãos mobilizados em Suqian, essa operação é altamente complexa.

Os funcionários, de forma implícita, tornam-se professores de dados para os robôs, que têm como objetivo substituir o trabalho humano de alta intensidade. Como projetar mecanismos de incentivo salarial e distribuição de benefícios que evitem resistência dos funcionários é uma questão que a JD precisa resolver.

No entanto, ainda não há detalhes concretos de implementação.

Um funcionário da JD em Pequim afirmou ao Wall Street Journal que ainda não ouviu falar do assunto. Para ele, se houver remuneração, isso seria uma ação de mercado, e a disposição dos funcionários em participar dependerá de cada um. Outro funcionário de Suqian também disse ao WSJ que ainda não recebeu nenhuma notificação.

Apesar de a comunicação oficial afirmar que “toda coleta de dados será feita estritamente de acordo com a lei e regulamentos”, a realidade costuma ser mais complexa.

No cenário de entregas, as linhas de armazenamento são padronizadas, mas a entrega ao consumidor final e os cenários de varejo envolvem características faciais e privacidade de milhões de consumidores.

Hoje, com a conformidade de dados cada vez mais rigorosa, o custo de desidentificação e limpeza de dezenas de milhares de dados não estruturados pode ser astronômico.

O paradoxo de Moravec

Em 1988, o robótico Hans Moravec concluiu:

“É fácil fazer um computador atingir o nível de um adulto em testes de inteligência ou xadrez, mas é extremamente difícil, quase impossível, fazê-lo possuir as percepções e movimentos de um bebê de um ano.”

Hoje, o paradoxo de Moravec na inteligência incorporada reflete principalmente a escassez de dados na indústria.

O sucesso de grandes modelos baseia-se na ingestão de trilhões de textos de alta qualidade acumulados ao longo de trinta anos na internet. Mas o mundo físico não possui uma internet pronta. Para escalar na realidade, a inteligência incorporada enfrenta uma enorme barreira de dados.

A grande operação da JD mira justamente esse ponto e os desafios de coleta de dados por trás dele.

Primeiro, a limitação dos simulações precisa ser resolvida.

Atualmente, a principal fonte de dados na indústria está se fragmentando e lutando contra seus próprios gargalos.

A maioria das startups depende fortemente de ambientes simulados, como o Isaac Sim da Nvidia ou MuJoCo, que usam motores físicos para treinar robôs virtualmente milhões de vezes. Essa abordagem é de baixo custo, rápida e evita danos físicos por tentativa e erro.

Porém, cada vez mais profissionais percebem as limitações do “Sim-to-Real”.

A complexidade do mundo físico não se resume às mudanças de luz e sombra, mas inclui feedbacks físicos sutis, como a flexibilidade de cabos, o não-rigidez de roupas, pequenas variações de atrito ao apertar parafusos, ou até o ruído eletromagnético dos sensores.

Os motores físicos atuais não conseguem simular perfeitamente essas leis físicas de alta dimensão e não linearidade. Isso faz com que modelos que funcionam bem na simulação apresentem problemas graves ao serem implantados em robôs reais.

Dado esse abismo, a alternativa é voltar ao mundo real.

Desde o Mobile ALOHA, que fez sucesso na Stanford, até empresas como Figure AI, Yushuu e Zhiyuan, que usam operações remotas — ou seja, humanos usando roupas de captura de movimento ou VR para controlar robôs como avatares, registrando dados visuais, de articulação e força — essa é a forma de coleta de dados de maior qualidade atualmente. Contudo, essa abordagem enfrenta o segundo maior problema de coleta de dados na prática: um custo de investimento e retorno altamente desfavorável.

Estima-se que uma única robô humanoide de tamanho completo custe dezenas ou centenas de milhares de dólares em hardware, além de altos custos de operação de operadores especializados.

Segundo o WSJ, a coleta e limpeza de um único dado de interação complexa pode custar centenas de dólares, com uma taxa de fracasso elevada.

Esse método artesanal de coleta de dados não consegue suportar a escala de bilhões ou trilhões de parâmetros que a inteligência incorporada requer.

Para reduzir custos, gigantes como Google lançaram iniciativas de conjuntos de dados abertos, como o Open X-Embodiment, reunindo dados de laboratórios globais para uso da indústria. No Brasil, algumas empresas também estão lançando conjuntos de dados reais de milhões de exemplos.

Porém, há um grande desafio oculto: a fragmentação extrema do hardware robótico. Cães, rodas, humanoides de diferentes fabricantes — cada um com graus de liberdade, torque, layout de sensores e centro de gravidade diferentes.

Um dado de alta qualidade treinado em um braço UR5, por exemplo, não pode ser transferido diretamente para um robô como o Tesla Optimus ou um robô de logística da JD.

Essa dificuldade de “mapeamento entre diferentes plataformas” faz com que a maior parte dos dados abertos acabe sendo um conjunto disperso de ilhas, sem efeito de escala.

Provavelmente, sob essa pressão, a lógica de negócios na área de inteligência incorporada mudou: quem possui cenários reais de aplicação tem uma vantagem competitiva na obtenção contínua de dados de alta qualidade e baixo custo.

Isso explica por que Tesla e JD optaram por rotas diferentes de muitas startups de hardware.

A Tesla, com suas gigantescas fábricas, permite que o Optimus aprenda na linha de montagem de baterias, testando e ajustando continuamente; enquanto a JD tenta criar uma linha de produção de dados semi-automatizada usando sua vasta rede de logística, dezenas de milhares de trabalhadores e o varejo físico.

Essa estratégia transforma as barreiras da cadeia de suprimentos em uma barreira de dados na era da IA.

Por outro lado, muitas startups de robótica sem seus próprios cenários precisam se reinventar — vendendo hardware barato para universidades e centros de pesquisa, em troca de dados compartilhados; ou alugando instalações industriais caras, ou contratando fornecedores de dados de inteligência incorporada como a JianZhi para criar conjuntos de dados sob medida.

Assim, a entrada da JD rasgou o véu do setor de inteligência incorporada, levando-o a uma fase de competição pesada por capital, cenários e mão de obra.

Na escassez de dados, as vantagens de algoritmos se reduzem, enquanto os gigantes que controlam as interfaces físicas do mundo real estão silenciosamente consolidando sua rede de acesso à AGI.

Dados de alta qualidade, mais escassos

Com o plano da JD de acumular mais de 10 milhões de horas de dados de cenários reais em dois anos, a reação do setor não é unânime de entusiasmo, mas de análise mais fria.

No contexto da inteligência incorporada, a qualidade e o modo dos dados são muito mais importantes do que a mera duração.

Especialistas apontam que o principal problema atual não é a captura de vídeos em primeira pessoa, mas a obtenção de “pares de estado e ação” que contenham feedback físico preciso.

Por exemplo, cidadãos de Suqian usando câmeras ao passear no supermercado, ou entregadores registrando o processo de entrega, geram uma quantidade enorme de dados visuais genéricos de internet.

Esses dados são valiosos para treinar modelos de mundo para robôs, ajudando-os a entender o que é uma porta ou uma maçã; mas são praticamente inúteis para treinar estratégias de controle — ou seja, ensinar o robô a aplicar a força certa para segurar uma maçã sem esmagá-la, por exemplo.

Um especialista do setor afirmou ao WSJ que o que os robôs realmente precisam são de dados valiosos, especialmente dados reais de robô. Para ele, a operação da JD ainda é uma terceirização de processos, uma atividade de BPO, fornecendo pessoas e locais.

Durante a manipulação física, há uma complexidade enorme de feedback tátil, força e ajuste de coordenadas espaciais, que esses dados de alta dimensão e conhecimento tácito não podem captar com dispositivos vestíveis comuns. Se os dezenas de milhares de trabalhadores apenas contribuírem com vídeos, a perda na conversão desses dados em ações executáveis será enorme.

Outro líder de uma grande empresa de robótica no país afirmou que o maior problema do setor é a “falta de padrão unificado para conjuntos de dados”.

Por exemplo, cada empresa de robótica tem diferentes graus de liberdade, posições de sensores, tipos de atuadores. Como mapear esses dados massivos de ações humanas para diferentes plataformas de robôs?

Sem um padrão unificado, esses 10 milhões de horas de dados podem acabar sendo apenas uma nutrição privada para os robôs próprios da JD, sem se transformar em infraestrutura que impulsione o avanço de toda a indústria.

Talvez seja por isso que a JD, em seu planejamento inicial, destacou especialmente a coleta de “100 mil horas de dados de plataformas robóticas”. O futuro da indústria está na pré-treinamento de vídeos genéricos de humanos para compreensão do mundo, na afinação de dados de alta qualidade de plataformas robóticas para aprender habilidades, e na autoexploração por reforço para evolução e iteração.

O anúncio da construção do centro de coleta de dados de inteligência incorporada pela JD marca o início de uma tentativa de usar uma abordagem escalável e engenheirada para resolver a escassez de dados na indústria robótica.

A combinação de cenários físicos e grande força de trabalho oferece uma nova via para acumulação de dados.

Porém, para que a “inteligência emergente” realmente aconteça, apenas aumentar a escala de dados não é suficiente.

Como garantir a alta dimensionalidade e qualidade dos dados na coleta massiva? Como estabelecer padrões unificados? E como lidar com privacidade e conformidade em escala? Essas serão questões essenciais para empresas e toda a indústria na fase de comercialização.

Aviso de risco e isenção de responsabilidade

O mercado possui riscos, e investimentos devem ser feitos com cautela. Este texto não constitui recomendação de investimento pessoal, nem leva em conta objetivos, situação financeira ou necessidades específicas de cada usuário. Os usuários devem avaliar se as opiniões, pontos de vista ou conclusões aqui apresentadas são compatíveis com suas condições particulares. Investimentos de risco são de responsabilidade do investidor.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.