人工智能的法律格局变得更加复杂:机器学习中的版权之争

robot
摘要生成中

关于人工智能训练数据的问题持续引发重大法律冲突。近日,一起集体诉讼指控Adobe在开发其AI系统的过程中不当使用了作者的文学作品,提出了关于科技公司如何收集和使用受版权保护内容的日益紧迫的质疑。

Adobe成焦点:争议细节

事件围绕加州公司SlimLM模型展开。根据由专门从事非小说类手册的俄勒冈州作家Elizabeth Lyon提出的起诉,Adobe涉嫌利用盗版的多部书籍——包括原告的作品——进行预训练SlimLM。公司将此项目描述为一系列紧凑的语言模型,旨在优化移动设备上的文档处理任务。

问题根源在于一系列处理过的数据集。SlimLM似乎基于Cerebras于2023年6月提供的多语料库开源数据集SlimPajama-627B。然而,起诉书指出,SlimPajama是对RedPajama数据集的操控派生,而RedPajama又包含Books3数据库——一个包含191,000卷,用于训练生成式AI系统的数据库。

行业中的系统性问题

这场法律诉讼是困扰科技行业的又一章。去年九月,苹果公司因类似指控其Apple Intelligence模型而被起诉,而十月,诉讼范围还扩展到Salesforce。两起案件都涉及未经授权或补偿原作者的情况下,错误使用含有受版权保护材料的数据集。

考虑到Anthropic与多位作家达成的协议,此事的重要性更为凸显。该公司已同意支付15亿美元,以解决关于在训练聊天机器人Claude时使用盗版作品的争议。这一交易可能为未来行业内的争端树立重要先例。

Firefly与Adobe的AI战略

值得强调的是,Adobe于2023年推出的多媒体生成套件Firefly,代表了公司在人工智能方向的核心战略。然而,这些法律争端可能削弱整个Adobe AI生态系统的信誉,并引发行业更严格的监管审查。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)