✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
Reddit 起诉 Anthropic,指控其在 AI 模型训练中涉嫌滥用用户数据
发现顶级金融科技新闻与活动!
订阅 FinTech Weekly 的通讯
由 JP Morgan、Coinbase、Blackrock、Klarna 等高管阅读
Reddit 就 Anthropic 未经授权使用用户数据提起诉讼
Reddit 已对人工智能公司 Anthropic 采取法律行动,指控该初创公司违反其服务条款,并从事该平台所称的“非法且不公平的商业行为”。周三在联邦法院提起的诉讼加剧了围绕使用公开可用的网页内容来训练商业 AI 系统的紧张局势。
根据起诉状,Reddit 指称 Anthropic 在未获得必要许可或授权的情况下,访问并利用了大量 Reddit 的用户生成内容来训练其 AI 模型。社交平台认为,这不仅违反了其政策,还在未经同意的情况下,将其用户的贡献用于商业获利。
该案凸显了生成式 AI 时代更广泛的问题:在线内容的所有权归谁,以及公司应如何对待携带隐私期待与社区信任细微差别的公开数据。
以内容使用与商业获利为根基的法律挑战
Reddit 指称,尽管 Anthropic 将自己包装为一家在伦理上驱动的 AI 公司,但其却无视 Reddit 的平台规则。
起诉状的核心在于:Anthropic 在未经授权的情况下,使用从 Reddit 抓取的数据(尤其是 Claude)来训练其 AI 模型。Reddit 指出,与签署了符合平台条款与用户保护的许可协议的 OpenAI 和 Google 不同,Anthropic 未能获得类似的许可。
这种差异可能是本案中的关键因素,尤其是在 AI 公司日益面临压力,需要进一步明确它们如何获取并处理训练数据——尤其是当这些数据来自包含用户贡献内容的平台时。
AI 热潮与平台紧张
自 2022 年末以来,生成式 AI 已推动整个科技行业发生重大变化,而像 Reddit 这样的娱乐平台已成为高价值的人类生成洞察、讨论与建议的仓库。这些特性使其对正在构建更强大、且具备更强上下文感知能力的模型的 AI 开发者而言极具吸引力。
Reddit 自身也已靠向 AI 产业。最近它宣布与 OpenAI 和 Google 建立合作伙伴关系,允许这些公司在特定许可条款下使用 Reddit 内容。这些交易旨在在保留用户隐私的同时,为平台 20 年的内容带来收入。
然而,据该诉讼所述,Anthropic 被指对 Reddit 数据的使用发生在上述协议之外。社交平台认为,这导致了直接的经济与声誉损害,并举例称:对其数据的未经授权商业使用,帮助竞争对手的产品提升。
Reddit 的法律团队强调,遵守平台规则并非可选项,尤其是在诸如金融科技与 AI 这样的领域,透明度与合规正日益受到用户和监管机构的审视。
市场影响与行业回应
周三,Reddit 股价上涨超过 6%,在诉讼消息公布后体现出投资者对公司决定维护其数据权利的支持。该公司于 2024 年初上市,目前市值约为 220 亿美元。
与此同时,Anthropic 迅速成为 AI 行业融资最为密集的初创公司之一。该公司在 3 月份估值为 615 亿美元,投资方包括 Amazon、Salesforce Ventures 和 Cisco Investments 等主要机构。
尽管 Anthropic 表示不同意 Reddit 的指控,但诉讼结果可能对 AI 公司如何开展数据收集产生长期影响。它也可能影响平台为训练用途定价或限制其内容访问的方式。
行业内部人士指出,尽管 AI 开发往往涉及从公共领域进行数据抓取,但**“公开可用”与“可商业使用”之间的界限仍不清晰**。像本案这样的法律纠纷,可能推动制定更明确的框架,在创新与合乎伦理的内容使用之间寻求平衡。
AI 中数据伦理的关注日益提升
Reddit 的这起法律行动属于一种更广泛的趋势:平台开始对它们所认为的 AI 公司剥削行为进行反击。随着越来越多的科技公司试图变现其数据资产,内容许可已成为一场“战场”。
Reddit 在其起诉状中已明确表示:它并不反对在 AI 训练中使用其数据,而是反对未经授权的使用。通过区分那些尊重其条款的公司(例如 OpenAI 和 Google)与那些据称不尊重的公司,Reddit 试图同时将自己定位为“对 AI 友好”并且“保护其用户社区”的平台。
起诉状中提到了 OpenAI 与 Reddit 现有的合作关系,而 Reddit 与 OpenAI 首席执行官 Sam Altman 之间的联系——后者曾是董事会成员且为主要股东——也进一步增加了这起诉讼背后背景的复杂性。
接下来会发生什么
随着法院程序推进,所有目光都将聚焦于司法体系将如何处理开放互联网内容与专有训练数据之间界限变得模糊的问题。本案可能为未来内容平台与 AI 开发者之间的纠纷树立先例。
目前而言,Reddit 的法律挑战进一步加剧了围绕 AI 模型如何被训练、以及平台所有者是否以及在多大程度上能够并应当控制对其用户贡献数据的访问所产生的紧张局势。
该诉讼也强化了一个信息:在不受监管的数据抓取时代可能正走向终结,尤其是随着公众对数据权利的认知不断提高,以及平台希望对其内容在 AI 应用中的使用方式施加更多控制。