Reddit poursuit Anthropic pour utilisation abusive présumée des données des utilisateurs dans la formation de modèles d'IA


Découvrez les meilleures actualités et événements fintech !

Abonnez-vous à la newsletter de FinTech Weekly

Lue par des dirigeants de JP Morgan, Coinbase, Blackrock, Klarna et plus encore


Reddit dépose une plainte contre Anthropic pour utilisation non autorisée des données utilisateur

Reddit a engagé une action en justice contre la société d’intelligence artificielle Anthropic, accusant la startup de violation de ses conditions d’utilisation et d’engager ce que la plateforme qualifie d’« actes commerciaux illégaux et déloyaux ». La plainte, déposée mercredi devant un tribunal fédéral, intensifie les tensions autour de l’utilisation de contenus web accessibles au public pour entraîner des systèmes d’IA commerciaux.

Selon la plainte, Reddit affirme qu’Anthropic a accédé et utilisé de grandes quantités de contenu généré par les utilisateurs de Reddit pour entraîner ses modèles d’IA sans obtenir les permissions ou licences nécessaires. La plateforme sociale soutient que cela viole non seulement ses politiques mais exploite aussi les contributions de ses utilisateurs à des fins commerciales sans consentement.

L’affaire soulève des questions plus larges sur la propriété du contenu en ligne à l’ère de l’IA générative, et sur la manière dont les entreprises devraient traiter les données publiques qui portent les nuances des attentes en matière de vie privée et de confiance communautaire.

Un défi juridique basé sur l’utilisation du contenu et le gain commercial

Reddit affirme qu’Anthropic, malgré sa présentation comme une entreprise d’IA éthiquement responsable, a agi en méconnaissance des règles de la plateforme Reddit.

Le cœur de la plainte repose sur l’allégation qu’Anthropic a entraîné ses modèles d’IA—notamment Claude—sur des données Reddit extraites sans autorisation. Reddit souligne que, contrairement à OpenAI et Google, qui ont conclu des accords de licence conformes aux conditions de la plateforme et à la protection des utilisateurs, Anthropic n’a pas obtenu de permissions similaires.

Cette distinction pourrait être un facteur clé dans l’affaire, surtout alors que les entreprises d’IA sont de plus en plus sous pression pour clarifier leur sourcing et leur gestion des données d’entraînement, en particulier lorsque ces données proviennent de plateformes avec du contenu généré par les utilisateurs.

Boom de l’IA et tensions sur les plateformes

Depuis la fin 2022, l’IA générative a entraîné des changements importants dans l’industrie technologique, avec des plateformes comme Reddit devenant des dépôts de valeur élevée pour des insights, discussions et conseils générés par l’humain. Ces qualités les rendent attractives pour les développeurs d’IA construisant des modèles plus performants et contextuellement sensibles.

Reddit lui-même a investi dans l’économie de l’IA, annonçant récemment des partenariats avec OpenAI et Google permettant à ces entreprises d’utiliser le contenu de Reddit selon des conditions de licence spécifiques. Ces accords visent à préserver la vie privée des utilisateurs tout en permettant de générer des revenus à partir des 20 ans de contenu de la plateforme.

L’utilisation présumée par Anthropic des données Reddit, cependant, s’est faite sans de tels accords, selon la plainte. La plateforme sociale affirme que cela a causé un préjudice financier et réputationnel direct, en citant une utilisation commerciale non autorisée de ses données pour améliorer les produits d’un concurrent.

L’équipe juridique de Reddit a souligné que respecter les règles de la plateforme n’est pas optionnel, en particulier dans des secteurs comme la fintech et l’IA où la transparence et la conformité sont de plus en plus scrutées par les utilisateurs et les régulateurs.

Implications pour le marché et réponse de l’industrie

L’action Reddit a augmenté de plus de 6 % mercredi suite à l’annonce de la plainte, ce qui indique le soutien des investisseurs à la décision de la société de faire respecter ses droits sur les données. La société, qui est devenue publique début 2024, possède actuellement une capitalisation boursière d’environ $22 milliards.

Anthropic, quant à elle, est rapidement devenue l’une des startups d’IA les mieux financées du secteur. La société était évaluée à 61,5 milliards de dollars en mars, avec le soutien de grands acteurs comme Amazon, Salesforce Ventures et Cisco Investments.

Bien qu’Anthropic ait déclaré qu’elle n’était pas d’accord avec les affirmations de Reddit, le résultat de la procédure pourrait avoir des implications à long terme sur la façon dont les entreprises d’IA abordent la collecte de données. Cela pourrait également influencer la tarification ou la restriction d’accès à leur contenu à des fins d’entraînement.

Des experts du secteur ont souligné que, même si le développement de l’IA implique souvent de scraper des données de domaines publics, la frontière entre “disponible publiquement” et “utilisable commercialement” reste floue. Des affaires juridiques comme celle-ci pourraient pousser à la mise en place de cadres plus précis qui équilibrent innovation et utilisation éthique du contenu.

Accent croissant sur l’éthique des données dans l’IA

L’action en justice de Reddit s’inscrit dans un mouvement plus large où les plateformes commencent à se défendre contre ce qu’elles perçoivent comme une exploitation par les entreprises d’IA. Alors que de plus en plus de sociétés technologiques cherchent à monétiser leurs actifs de données, la licence de contenu devient un terrain de bataille.

Reddit a clairement indiqué dans sa plainte qu’il n’est pas opposé à l’utilisation de ses données pour l’entraînement de l’IA, mais s’oppose à leur utilisation non autorisée. En faisant la distinction entre les entreprises qui respectent ses conditions—comme OpenAI et Google—et celles qui, selon lui, ne le font pas, Reddit cherche à se positionner comme une plateforme à la fois favorable à l’IA et protectrice de sa communauté d’utilisateurs.

La collaboration existante entre OpenAI et Reddit a été mentionnée dans la plainte, et la relation entre Reddit et Sam Altman, PDG d’OpenAI, ancien membre du conseil d’administration et actionnaire majeur, ajoute une complexité supplémentaire au contexte de la procédure.

Ce qui nous attend

Au fur et à mesure que la procédure judiciaire progresse, tous les regards seront tournés vers la manière dont le système juridique traitera la ligne floue entre contenu internet ouvert et données d’entraînement propriétaires. L’affaire pourrait établir un précédent pour de futurs litiges entre plateformes de contenu et développeurs d’IA.

Pour l’instant, la contestation juridique de Reddit s’ajoute à la tension croissante sur la façon dont les modèles d’IA sont entraînés et sur le degré auquel les propriétaires de plateformes peuvent ou doivent contrôler l’accès aux données générées par leurs utilisateurs.

La plainte renforce également le message selon lequel l’ère du scraping de données non régulé pourrait toucher à sa fin, surtout à mesure que la conscience publique des droits sur les données s’accroît et que les plateformes cherchent à exercer davantage de contrôle sur l’utilisation de leur contenu dans les applications d’IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler