Reddit、AIモデルのトレーニングにおけるユーザーデータの不正使用でAnthropicを提訴


注目のフィンテックニュースとイベントを見つけよう!

FinTech Weeklyのニュースレターを購読する

JPモルガン、Coinbase、Blackrock、Klarnaなどのエグゼクティブが読む


Reddit、Anthropicを告訴――ユーザーデータの無断利用をめぐって

Redditは、人工知能企業のAnthropicに対して法的措置を取り、スタートアップが利用規約に違反したとして非難するとともに、同プラットフォームが「違法で不公正な商行為」と呼ぶ行為に関与したと主張した。連邦裁判所に水曜日に提出されたこの訴訟は、公開されているWebコンテンツを使って商用AIシステムを訓練することをめぐる緊張をさらに高めている。

申し立てによれば、RedditはAnthropicが必要な許可やライセンスを取得せずに、大量のRedditのユーザー生成コンテンツにアクセスし、それを利用してAIモデルを訓練したと主張している。ソーシャルプラットフォームは、これが自社の方針に違反するだけでなく、同意なくユーザーの貢献を商業的な利益のために活用していると論じている。

このケースは、生成AIの時代にオンラインコンテンツの所有権を誰が持つのか、また、プライバシーへの期待やコミュニティの信頼というニュアンスを含む公的データを企業がどのように扱うべきなのか、というより広い問いを浮き彫りにしている。

コンテンツ利用と商業的利益に根差した法的争い

Redditは、倫理に根差したAI企業であると自らを位置づけているにもかかわらず、AnthropicがRedditのプラットフォーム規則を軽視する行動を取ったと主張している。

申し立ての中核は、AnthropicがRedditのデータを許可なくスクレイピングしたものを、最も顕著にはClaudeであるAIモデルの訓練に使ったという主張にある。Redditは、プラットフォームの利用規約およびユーザー保護に準拠するライセンス契約を締結したOpenAIやGoogleとは異なり、Anthropicは同様の許可を確保できなかったと指摘している。

この違いは、特に、AI企業が訓練データの出所や取り扱いを明確化することにますます圧力がかかっている状況では、訴訟における重要な要因になり得る。とりわけ、そのデータがユーザーが投稿したコンテンツを持つプラットフォームから来ている場合だ。

AIブームとプラットフォーム間の緊張

2022年後半以来、生成AIはテック業界全体に大きな変化をもたらしており、Redditのようなプラットフォームは、人間が生み出した洞察、議論、アドバイスの高価値なリポジトリになっている。これらの特性は、より能力が高く、文脈を理解するモデルを構築するAI開発者にとって魅力的に映る。

Reddit自体もAI経済に踏み込み、最近、特定のライセンス条件のもとでそれらの企業がRedditコンテンツを使えるようにするOpenAIおよびGoogleとの提携を発表した。これらの取り決めは、プラットフォームの20年分のコンテンツから収益を得つつ、ユーザープライバシーを保護することを意図している。

しかし、訴訟によれば、AnthropicによるRedditデータの利用は、そのような合意なしに行われたという。ソーシャルプラットフォームは、これにより、競合の製品を強化するためにデータを無許可で商業利用したことが原因で、直接的な金銭的・評判上の損害が生じたと主張している。

Redditの法務チームは、特にフィンテックやAIのような分野では、プラットフォーム規則を尊重することは任意ではないと強調した。そこでは、透明性とコンプライアンスが、ユーザーと規制当局の双方からますます厳しく精査されている。

市場への含意と業界の反応

Redditの株価は、訴訟の発表を受けて水曜日に6%以上上昇し、データ権を行使する同社の判断に投資家が支持を示したことを示した。同社は2024年初めに上場し、現在の時価総額はおよそ220億ドル。

一方でAnthropicは、AI業界で最も資金が厚く集まっているスタートアップの一つとして急速に存在感を高めている。同社は3月時点で615億ドルと評価されており、Amazon、Salesforce Ventures、Cisco Investmentsのような主要プレイヤーからの支援があった。

AnthropicはRedditの主張に同意していないと述べているものの、訴訟の結果は、AI企業がデータ収集にどう取り組むかについて長期的な影響を及ぼし得る。また、訓練目的で自社コンテンツへのアクセスを、プラットフォームがどのように価格設定し、どのように制限するかにも影響する可能性がある。

業界関係者は、AI開発がしばしばパブリックドメインからのデータスクレイピングを含むとはいえ、「公開されている」ことと「商業的に利用可能」であることの境界は依然として不明確だと指摘している。こうした訴訟は、革新性と倫理的なコンテンツ利用のバランスを取るための、より明確な枠組みを求める動きを後押しするかもしれない。

AIにおけるデータ倫理への関心の高まり

Redditによる今回の法的措置は、プラットフォームが、自分たちが「搾取されている」と見なすAI企業の行為に対して反撃を始める、より広範な流れの一部だ。テック企業がデータ資産を収益化しようとする動きが強まるほど、コンテンツのライセンシングは争点となる「戦場」になっている。

Redditは、AI訓練における自社データの利用に反対しているのではなく、むしろ無許可での利用に反対しているのだと、申し立ての中で明確にしている。OpenAIやGoogleのように自社の条件を尊重する企業と、そうでないとされる企業を区別することで、Redditは自らを「AIに友好的」であると同時に、ユーザーコミュニティを守る存在として位置づけようとしている。

申し立てでは、RedditとのOpenAIの既存の提携が言及されており、過去に取締役だった元取締役であり主要株主でもあるSam Altman氏(OpenAI CEO)とRedditのつながりは、訴訟の背景にさらに複雑さを加えている。

次に何が起きるか

裁判手続きが進むにつれ、オープンなインターネット上のコンテンツと専有的な訓練データのあいだで、どこで線引きがなされるのかに注目が集まることになる。このケースは、コンテンツプラットフォームとAI開発者の間で今後起こり得る紛争に対して、前例を作る可能性がある。

ひとまず、Redditの法的挑戦は、AIモデルがどのように訓練されるのか、そして、プラットフォーム運営者がユーザーが投稿したデータへのアクセスをどこまでコントロールでき、またすべきなのか、という高まる緊張に拍車をかけることになる。

さらに、この訴訟は、規制されないデータスクレイピングの時代が終わりに向かっているというメッセージも裏づけている。とりわけ、データ権に対する公的な認知が広がり、プラットフォームがAIアプリケーションで自社コンテンツがどう使われるかについて、より多くの主導権を主張しようとしている状況では、その傾向は強まっている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン