Reddit、AIモデルのトレーニングにおけるユーザーデータの不正使用でAnthropicを提訴


フィンテックの最新ニュースとイベントを発見しよう!

FinTech Weeklyのニュースレターに登録する

JPモルガン、コインベース、ブラックロック、クラーナなどの経営者に読まれています


RedditがAnthropicに対してユーザーデータの無断使用で訴訟を提起

Redditは、人工知能企業Anthropicに対して法的措置を講じ、スタートアップがサービス利用規約に違反し、プラットフォームが「不法かつ不公正なビジネス行為」と呼ぶ行為を行ったと非難しています。この訴訟は、水曜日に連邦裁判所に提起され、商業的なAIシステムを訓練するために公開されているウェブコンテンツの使用に関する緊張を高めています。

訴状によると、RedditはAnthropicが必要な許可やライセンスを取得せずに大量のRedditユーザー生成コンテンツにアクセスし、そのAIモデルを訓練するために利用したと主張しています。ソーシャルプラットフォームは、これが自身のポリシーに違反するだけでなく、ユーザーの貢献を同意なしに商業的利益のために搾取していると主張しています。

この事件は、生成AIの時代においてオンラインコンテンツの所有権についてのより広範な疑問を浮き彫りにし、企業がプライバシーの期待やコミュニティの信頼を持つ公共データをどのように扱うべきかを考えさせます。

コンテンツ使用と商業的利益に根ざした法的挑戦

Redditは、Anthropicが倫理的なAI企業として自らを位置づけているにもかかわらず、Redditのプラットフォームルールを無視して行動していると主張しています。

訴状の核心は、Anthropicが許可なくスクレイピングしたRedditデータでAIモデル—特にClaude—を訓練したという主張にあります。Redditは、OpenAIやGoogleがプラットフォームの利用規約やユーザー保護に準拠したライセンス契約を結んでいるのに対し、Anthropicは同様の許可を取得できなかった点を指摘しています。

この区別は、特にAI企業がどのようにデータを取得し、扱うかを明確にすることがますます求められる中で、事件の重要な要素になる可能性があります。

AIブームとプラットフォームの緊張

2022年後半以来、生成AIはテクノロジー業界全体に大きな変化をもたらし、Redditのようなプラットフォームは人間が生成した洞察、議論、アドバイスの高価値な貯蔵庫となっています。これらの特性は、より能力が高く文脈を理解するモデルを構築するAI開発者にとって魅力的です。

Reddit自身はAI経済に乗り出し、最近OpenAIやGoogleとのパートナーシップを発表し、特定のライセンス条件の下でRedditコンテンツを利用することを許可しています。これらの契約は、20年分のコンテンツからの収益を可能にしつつ、ユーザーのプライバシーを保護することを目的としています。

しかし、訴訟によれば、AnthropicのRedditデータの使用はそのような契約なしに行われたとされています。ソーシャルプラットフォームは、これにより直接的な財政的及び評判の被害が生じたと主張し、競合他社の製品を向上させるために自社データの無断商業利用があったとしています。

Redditの法務チームは、プラットフォームルールを尊重することは任意ではなく、特にフィンテックやAIのような分野ではユーザーや規制当局からの透明性とコンプライアンスがますます注目されていると強調しています。

市場への影響と業界の反応

訴訟発表後、水曜日にRedditの株価は6%以上上昇し、データ権利を主張する会社の決定に対する投資家の支持を示しました。この会社は2024年初頭に上場し、現在の時価総額は約220億ドルです。

一方、AnthropicはAI業界で最も資金を投入されているスタートアップの一つとなっています。この会社は3月に615億ドルの評価を受けており、Amazon、Salesforce Ventures、Cisco Investmentsのような大手から支援を受けています。

AnthropicはRedditの主張に同意しないと述べていますが、訴訟の結果はAI企業がデータ収集にどのようにアプローチするかに長期的な影響を与える可能性があります。また、プラットフォームが訓練目的で自社コンテンツへのアクセスをどのように価格設定または制限するかにも影響を与えるかもしれません。

業界の関係者は、AIの開発が公開ドメインからのデータスクレイピングを伴うことが多いにもかかわらず、「公開利用可能」と「商業利用可能」の境界は不明確であると指摘しています。このような法的事件は、革新と倫理的コンテンツ使用のバランスを取るためのより明確な枠組みを推進する可能性があります。

AIにおけるデータ倫理への関心の高まり

Redditによる法的措置は、プラットフォームがAI企業による搾取に対して反撃を始めているという広範なパターンの一部です。より多くのテクノロジー企業がデータ資産をマネタイズしようとする中で、コンテンツライセンスは戦場となっています。

Redditは訴状で、AI訓練におけるデータ使用に反対しているのではなく、無断使用に反対していることを明確にしています。OpenAIやGoogleのようにその条件を尊重する企業と、そうでない企業との違いを引き出すことで、RedditはAIに友好的でありながらユーザーコミュニティを保護する立場を示そうとしています。

訴状には、OpenAIとRedditの既存のパートナーシップが言及されており、RedditとOpenAIのCEOであるサム・アルトマンとのつながりが訴訟の背景にさらなる複雑さを加えています。

今後の展望

裁判手続きが進む中、オープンなインターネットコンテンツと独自の訓練データとの間のあいまいな境界を法律がどのように扱うかに注目が集まります。この事件は、コンテンツプラットフォームとAI開発者の間の将来の争いの先例を設定する可能性があります。

現時点では、Redditの法的挑戦は、AIモデルがどのように訓練されるか、そしてプラットフォーム所有者が自社のユーザー提供データへのアクセスをどの程度制御できるか、すべきかという緊張を高めるものとなっています。

この訴訟はまた、データ権に対する公共の意識が高まる中、特にプラットフォームが自社のコンテンツがAIアプリケーションでどのように使用されるかについてより多くの制御を主張しようとする中で、無規制のデータスクレイピングの時代が終わりを迎えようとしているというメッセージを強化しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン