Reddit Processa Anthropic por Alegada Utilização Indevida de Dados de Utilizadores no Treino de Modelos de IA


Descubra as principais notícias e eventos de fintech!

Subscreva a newsletter da FinTech Weekly

Lida por executivos da JP Morgan, Coinbase, Blackrock, Klarna e mais


Reddit apresenta uma ação judicial contra a Anthropic por uso não autorizado de dados dos utilizadores

A Reddit tomou medidas legais contra a empresa de inteligência artificial Anthropic, acusando o arranque de violar os seus termos de serviço e de praticar aquilo que a plataforma descreve como “atos comerciais ilícitos e injustos”. A ação judicial, apresentada na quarta-feira em tribunal federal, escalou as tensões em torno do uso de conteúdos web publicamente disponíveis para treinar sistemas comerciais de IA.

De acordo com a queixa, a Reddit alega que a Anthropic acedeu e utilizou grandes volumes de conteúdos gerados pelos utilizadores da Reddit para treinar os seus modelos de IA sem obter as permissões ou licenças necessárias. A plataforma social sustenta que esta situação não só viola as suas políticas, como também explora as contribuições dos seus utilizadores para obter ganhos comerciais sem consentimento.

O caso levanta questões mais amplas sobre quem detém a propriedade do conteúdo online na era da IA generativa e sobre como as empresas devem tratar os dados públicos que carregam nuances de expectativas de privacidade e confiança da comunidade.

Um desafio legal enraizado no uso de conteúdos e no ganho comercial

A Reddit afirma que a Anthropic, apesar de se apresentar como uma empresa de IA movida por princípios éticos, agiu desrespeitando as regras da plataforma da Reddit.

O cerne da queixa centra-se na alegação de que a Anthropic treinou os seus modelos de IA—mais notavelmente o Claude—com dados da Reddit recolhidos por scraping sem autorização. A Reddit aponta que, ao contrário da OpenAI e da Google, que celebraram acordos de licenciamento que cumprem os termos da plataforma e as proteções dos utilizadores, a Anthropic não conseguiu obter permissões semelhantes.

Esta diferença poderá ser um fator-chave no caso, especialmente à medida que as empresas de IA enfrentam uma pressão crescente para clarificar como é que obtêm e tratam dados de treino, sobretudo quando esses dados provêm de plataformas com conteúdos contribuídos pelos utilizadores.

Boom de IA e tensões na plataforma

Desde finais de 2022, a IA generativa tem impulsionado mudanças substanciais em toda a indústria tecnológica, com plataformas como a Reddit a tornarem-se repositórios de elevado valor para insights, discussões e conselhos gerados por humanos. Estas características tornam-nos particularmente atrativos para programadores de IA que desenvolvem modelos mais capazes e sensíveis ao contexto.

A própria Reddit tem-se apoiado na economia da IA, anunciando recentemente parcerias com a OpenAI e a Google que permitem que essas empresas usem conteúdos da Reddit ao abrigo de termos de licenciamento específicos. Esses acordos destinam-se a preservar a privacidade dos utilizadores, ao mesmo tempo que permitem obter receitas com os 20 anos de conteúdo da plataforma.

O alegado uso de dados da Reddit por parte da Anthropic, no entanto, ocorreu sem tais acordos, segundo a ação judicial. A plataforma social argumenta que isso causou danos financeiros e reputacionais diretos, apontando para a utilização comercial não autorizada dos seus dados para melhorar os produtos de um concorrente.

A equipa jurídica da Reddit sublinhou que respeitar as regras da plataforma não é opcional, particularmente em setores como fintech e IA, onde a transparência e a conformidade estão sob escrutínio crescente tanto por parte dos utilizadores como dos reguladores.

Implicações para o mercado e resposta da indústria

As ações da Reddit subiram mais de 6% na quarta-feira após o anúncio da ação judicial, sinalizando apoio dos investidores à decisão da empresa de fazer valer os seus direitos sobre os dados. A empresa, que abriu capital no início de 2024, tem atualmente uma capitalização bolsista de aproximadamente 22 mil milhões de dólares.

Entretanto, a Anthropic tornou-se rapidamente um dos arranques de IA mais financiados da indústria. A empresa foi avaliada em 61,5 mil milhões de dólares em março, com apoio de grandes intervenientes como Amazon, Salesforce Ventures e Cisco Investments.

Embora a Anthropic tenha afirmado que discorda das alegações da Reddit, o desfecho da ação judicial poderá ter implicações a longo prazo para a forma como as empresas de IA abordam a recolha de dados. Poderá também influenciar como as plataformas definem preços ou restringem o acesso ao seu conteúdo para fins de treino.

Insiders da indústria apontaram que, apesar de o desenvolvimento de IA envolver frequentemente scraping de dados a partir de domínios públicos, o limite entre “publicamente disponível” e “utilizável comercialmente” permanece pouco claro. Casos legais como este podem impulsionar a criação de enquadramentos mais definidos que equilibrem a inovação com o uso ético de conteúdos.

A crescente atenção à ética dos dados na IA

A ação legal da Reddit faz parte de um padrão mais amplo em que as plataformas estão a começar a reagir ao que consideram exploração por parte de empresas de IA. À medida que mais empresas tecnológicas procuram monetizar os seus ativos de dados, o licenciamento de conteúdos tornou-se um campo de batalha.

A Reddit deixou claro na sua queixa que não se opõe ao uso dos seus dados no treino de IA, mas sim ao seu uso não autorizado. Ao estabelecer uma distinção entre empresas que respeitam os seus termos—como a OpenAI e a Google—e aquelas que alegadamente não o fazem, a Reddit procura posicionar-se como simultaneamente favorável à IA e protetora da sua comunidade de utilizadores.

A parceria existente da OpenAI com a Reddit foi mencionada na queixa, e a ligação entre a Reddit e o CEO da OpenAI, Sam Altman, um antigo membro do conselho e um grande acionista, acrescenta ainda mais complexidade ao pano de fundo do processo judicial.

O que vem a seguir

À medida que o processo judicial se desenrola, todos os olhares estarão voltados para a forma como o sistema legal aborda as fronteiras desfocadas entre conteúdos abertos da internet e dados de treino proprietários. O caso poderá estabelecer um precedente para futuros litígios entre plataformas de conteúdos e programadores de IA.

Por agora, o desafio legal da Reddit aumenta a tensão crescente sobre como os modelos de IA são treinados e o grau em que os proprietários das plataformas podem e devem controlar o acesso aos seus dados contribuídos pelos utilizadores.

A ação judicial reforça também a mensagem de que a era do scraping de dados sem regulamentação poderá estar a chegar ao fim, especialmente à medida que aumenta a consciencialização do público sobre os direitos de dados e as plataformas procuram afirmar um maior controlo sobre a forma como os seus conteúdos são utilizados em aplicações de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar