Reddit Processa Anthropic por Alegada Utilização Indevida de Dados de Utilizadores no Treino de Modelos de IA


Descubra as principais notícias e eventos de fintech!

Subscreva a newsletter do FinTech Weekly

Lida por executivos da JP Morgan, Coinbase, Blackrock, Klarna e mais


Reddit intenta uma ação judicial contra a Anthropic por uso não autorizado de dados dos utilizadores

A Reddit tomou medidas legais contra a empresa de inteligência artificial Anthropic, acusando o arranque de violar os seus termos de serviço e de se envolver no que a plataforma descreve como “atos comerciais ilícitos e injustos”. O processo, apresentado na quarta-feira num tribunal federal, intensifica as tensões em torno do uso de conteúdos web publicamente disponíveis para treinar sistemas comerciais de IA.

De acordo com a queixa, a Reddit alega que a Anthropic acedeu e utilizou grandes volumes de conteúdo gerado pelos utilizadores da Reddit para treinar os seus modelos de IA, sem obter as permissões ou licenças necessárias. A plataforma social sustenta que isto não só viola as suas políticas como também explora as contribuições dos seus utilizadores para ganho comercial sem consentimento.

O caso realça questões mais abrangentes sobre quem detém conteúdos online na era da IA generativa e sobre como as empresas devem tratar os dados públicos que transportam nuances de expectativas de privacidade e de confiança da comunidade.

Um Desafio Legal Enraizado no Uso de Conteúdo e no Ganho Comercial

A Reddit afirma que a Anthropic, apesar de se apresentar como uma empresa de IA movida por princípios éticos, agiu em desrespeito pelas regras da plataforma da Reddit.

O cerne da queixa centra-se na alegação de que a Anthropic treinou os seus modelos de IA—mais notavelmente o Claude—com dados do Reddit recolhidos sem autorização. A Reddit salienta que, ao contrário da OpenAI e da Google, que celebraram acordos de licenciamento que cumprem os termos da plataforma e as proteções para utilizadores, a Anthropic não conseguiu obter permissões semelhantes.

Esta diferença poderá ser um fator decisivo no caso, especialmente à medida que as empresas de IA são cada vez mais pressionadas para clarificar como obtêm e gerem os dados de treino, sobretudo quando esses dados provêm de plataformas com conteúdos contribuídos pelos utilizadores.

Boom da IA e Tensões na Plataforma

Desde finais de 2022, a IA generativa impulsionou mudanças substanciais em toda a indústria tecnológica, com plataformas como a Reddit a tornarem-se repositórios de elevado valor para insights, discussões e conselhos gerados por humanos. Estas características tornam-nas atrativas para programadores de IA que constroem modelos mais capazes e sensíveis ao contexto.

A própria Reddit tem apostado na economia da IA, tendo anunciado recentemente parcerias com a OpenAI e a Google que permitem que essas empresas utilizem conteúdos da Reddit ao abrigo de termos de licenciamento específicos. Estes acordos destinam-se a preservar a privacidade dos utilizadores, ao mesmo tempo que permitem gerar receitas com os 20 anos de conteúdo da plataforma.

O alegado uso de dados da Reddit por parte da Anthropic, no entanto, ocorreu sem tais acordos, segundo o processo. A plataforma social argumenta que isso causou danos financeiros e reputacionais diretos, citando o uso comercial não autorizado dos seus dados para melhorar os produtos de um concorrente.

A equipa jurídica da Reddit sublinhou que respeitar as regras da plataforma não é uma opção, em particular em setores como fintech e IA, onde a transparência e a conformidade estão a ser cada vez mais escrutinadas tanto pelos utilizadores como pelos reguladores.

Implicações no Mercado e Resposta da Indústria

As ações da Reddit subiram mais de 6% na quarta-feira após o anúncio do processo, sinalizando apoio dos investidores à decisão da empresa de fazer valer os seus direitos sobre os dados. A empresa, que abriu o capital no início de 2024, detém atualmente uma capitalização bolsista de aproximadamente $22 mil milhões.

Entretanto, a Anthropic tornou-se rapidamente um dos arranques do setor da IA com mais financiamento. A empresa foi avaliada em $61,5 mil milhões em março, com apoio de grandes intervenientes como Amazon, Salesforce Ventures e Cisco Investments.

Embora a Anthropic tenha afirmado discordar das alegações da Reddit, o desfecho do processo poderá ter implicações a longo prazo para a forma como as empresas de IA abordam a recolha de dados. Poderá também influenciar a forma como as plataformas definem preços ou restringem o acesso aos seus conteúdos para fins de treino.

Especialistas da indústria apontaram que, apesar de o desenvolvimento de IA envolver frequentemente recolha de dados (scraping) a partir de domínios públicos, a fronteira entre “publicamente disponível” e “utilizável comercialmente” continua pouco clara. Casos legais como este podem impulsionar a criação de quadros mais definidos que equilibrem a inovação com o uso ético de conteúdos.

Aumenta o Foco na Ética dos Dados em IA

A ação legal da Reddit faz parte de um padrão mais amplo em que as plataformas começam a reagir contra o que consideram ser exploração por parte de empresas de IA. À medida que mais empresas tecnológicas procuram monetizar os seus ativos de dados, o licenciamento de conteúdos tornou-se um campo de batalha.

A Reddit deixou claro, na sua queixa, que não se opõe ao uso dos seus dados no treino de IA, mas sim ao uso não autorizado. Ao traçar uma distinção entre empresas que respeitam os seus termos—como OpenAI e Google—e aquelas que alegadamente não o fazem, a Reddit pretende posicionar-se como simultaneamente favorável à IA e protetora da sua comunidade de utilizadores.

A parceria existente da OpenAI com a Reddit foi referida na queixa, e a ligação entre a Reddit e o CEO da OpenAI, Sam Altman, um antigo membro do conselho e grande acionista, acrescenta ainda mais complexidade ao pano de fundo do processo.

O que Acontece a Seguir

À medida que o processo judicial avança, todos os olhares estarão voltados para a forma como o sistema jurídico trata as linhas ténues entre conteúdos abertos da internet e dados proprietários de treino. O caso poderá estabelecer um precedente para futuros litígios entre plataformas de conteúdos e programadores de IA.

Por agora, o desafio legal da Reddit aumenta as tensões crescentes sobre como os modelos de IA são treinados e o grau em que os proprietários de plataformas podem e devem controlar o acesso aos seus dados contribuídos pelos utilizadores.

O processo também reforça a mensagem de que a era da recolha não regulamentada de dados poderá estar a chegar ao fim, especialmente à medida que cresce a consciencialização do público sobre os direitos sobre os dados e as plataformas procuram afirmar mais controlo sobre a forma como os seus conteúdos são utilizados em aplicações de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar