Reddit、AIモデルのトレーニングにおけるユーザーデータの不正使用でAnthropicを提訴


トップのフィンテックニュースとイベントを見つけよう!

FinTech Weeklyのニュースレターを購読

JPモルガン、Coinbase、Blackrock、Klarnaなどのエグゼクティブが読んでいます


Reddit、無許可のユーザーデータ使用をめぐるAnthropicに対する法的根拠の挑戦

Redditは、人工知能企業Anthropicに対して法的措置を取り、同スタートアップが利用規約に違反し、プラットフォームが「不法かつ不公正なビジネス行為」と呼ぶことに関与したとして非難している。水曜日に連邦裁判所へ提出されたこの訴訟は、公開されているWebコンテンツを利用して商用AIシステムを訓練することをめぐる緊張をさらに高めるものだ。

申立書によれば、Redditは、Anthropicが必要な許可やライセンスを取得せずに、Redditのユーザー生成コンテンツの大量にアクセスして利用し、それによってAIモデルを訓練したと主張している。ソーシャルプラットフォームは、これは同社の方針に違反するだけでなく、ユーザーの貢献を無断で商業的利益のために利用していると指摘している。

この案件は、生成AIの時代において、オンラインコンテンツの所有権や、プライバシーの期待とコミュニティの信頼を含む公開データの扱いについてのより広範な問題を浮き彫りにしている。

コンテンツ利用と商業的利益に根ざした法的根拠の挑戦

Redditは、倫理的に推進されるAI企業として自らを位置づけているにもかかわらず、AnthropicがRedditのプラットフォーム規則を無視して行動してきたと主張している。

申立書の中心は、Anthropicが、無許可でスクレイピングされたRedditのデータを用いて、ClaudeをはじめとするAIモデルを訓練したという主張にある。Redditは、OpenAIやGoogleのように、プラットフォームの規約とユーザープロテクションに準拠したライセンス契約を締結した企業と異なり、Anthropicは同様の許可を得ていなかったと指摘している。

この違いは、特にAI企業が訓練データの調達と取り扱いについて明確にする必要性が高まる中で、重要なポイントとなる可能性がある。特に、データがユーザー投稿からなるプラットフォームから来る場合はなおさらだ。

AIブームとプラットフォーム間の緊張

2022年後半以降、生成AIはテック業界に大きな変革をもたらし、Redditのようなプラットフォームは、人間が生成した洞察や議論、助言の宝庫となっている。これらの特性は、より高度で文脈を理解できるモデルを構築するAI開発者にとって魅力的だ。

Reddit自身もAI経済に積極的に関与し、最近ではOpenAIやGoogleと提携し、特定のライセンス条件の下でRedditのコンテンツを利用できるようにしている。これらの契約は、ユーザープライバシーを保護しつつ、20年以上にわたるコンテンツから収益を得ることを目的としている。

しかしながら、訴訟によると、AnthropicによるRedditデータの利用は、そのような合意なしに行われたとされる。ソーシャルプラットフォームは、これにより直接的な金銭的損害や評判の毀損が生じたと主張し、無許可の商業利用による競合他社の製品強化に使われたと指摘している。

Redditの法務チームは、特にフィンテックやAIの分野では、透明性とコンプライアンスがますます厳しく監視されているため、プラットフォームの規則を尊重することは義務であると強調した。

市場への影響と業界の反応

Redditの株価は、水曜日の訴訟提起発表後に6%以上上昇し、データ権利を守る同社の決定に対する投資家の支持を示した。2024年初めに上場した同社の時価総額は約220億ドルと見積もられている。

一方、Anthropicは、AI業界で最も資金調達が盛んなスタートアップの一つとなっている。同社は3月に615億ドルの評価を受けており、Amazon、Salesforce Ventures、Cisco Investmentsなどの大手から出資を受けている。

同社はRedditの主張に異議を唱えているが、訴訟の結果は、AI企業がデータ収集の方法をどう扱うかに長期的な影響を与える可能性がある。また、プラットフォームが訓練用コンテンツのアクセスをどう価格設定し制限するかにも影響を及ぼすだろう。

業界関係者は、AI開発はしばしば公開領域からのデータスクレイピングを伴うが、「公開されている」ことと「商業的に利用可能」なことの境界は依然として不明確だと指摘している。このような法的事例は、イノベーションと倫理的コンテンツ利用のバランスを取るためのより明確な枠組みの必要性を促す可能性がある。

AIにおけるデータ倫理への関心の高まり

Redditの今回の法的措置は、プラットフォームがAI企業による搾取とみなす行為に対して反発を強めている、より広範な動きの一環だ。データ資産の収益化を目指す企業が増える中、コンテンツのライセンスは争点となっている。

Redditは、AI訓練における自社データの利用に反対しているのではなく、無許可の使用に反対していると明確にしている。OpenAIやGoogleのように規約を尊重する企業と、そうでないとされる企業とを区別し、自社がAIに対して協力的でありながら、ユーザーコミュニティを守る存在であることを示そうとしている。

申立書には、RedditとOpenAIの既存の提携も言及されており、さらに、RedditとOpenAIのCEOサム・アルトマン(元取締役かつ主要株主)とのつながりも、訴訟の背景に複雑さを加えている。

今後の展望

裁判手続きが進むにつれ、オープンなインターネット上のコンテンツと、企業が所有し訓練に用いるデータとの境界線が、法的にどのように扱われるのかが注目される。このケースは、今後のコンテンツプラットフォームとAI開発者間の紛争において、前例となる可能性がある。

現時点では、Redditの法的挑戦は、AIモデルの訓練方法や、プラットフォーム所有者がユーザー投稿データへのアクセスをどの程度制御できるか、またすべきかについての緊張をさらに高めている。

また、この訴訟は、規制されていないデータスクレイピングの時代が終わりに近づいていることを示すメッセージでもあり、データ権に対する公的な認知の高まりとともに、プラットフォームが自社コンテンツのAI利用に対してより強いコントロールを主張しようとしていることを裏付けている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン