Anthropic,一家重要的生成式人工智能初创公司,对一群音乐出版商和内容所有者对其提出的侵权指控提出了无效的辩护。在一份周三的新的法庭文件中,Anthropic详细阐述了为何这群音乐出版商的指控是无效的。
在2023年秋季,包括Concord、Universal和ABKCO在内的音乐出版商对Anthropic提起了诉讼,指控其通过其聊天机器人Claude(现已由Claude2取代)侵犯了版权。诉状在田纳西州的联邦法院(美国的“音乐之城”之一,许多唱片公司和音乐家的所在地)提出,声称Anthropic的业务从“非法”从互联网上抓取歌词来训练其人工智能模型,然后以聊天机器人的形式为用户复制这些受版权保护的歌词。
对于对初步禁令的反应——如果法庭批准,将迫使Anthropic停止提供其Claude AI模型——Anthropic提出了在涉及AI训练数据的众多其他版权争端中已经出现的熟悉论点。像OpenAI和Anthropic这样的生成式人工智能公司在很大程度上依赖于从公开可获得的大量数据中抓取信息,包括受版权保护的作品,以训练其模型,但它们坚持认为这种使用在法律上构成了合理使用。预计数据抓取版权问题将会上升到最高法院。
在其回应中,Anthropic辩称其“使用原告的歌词来训练Claude是一种变革性使用”,为原始作品添加了“进一步的目的或不同的特性”。为了支持这一点,文件直接引用了Anthropic研究总监Jared Kaplan的话,他表示目的是“创建一个数据集,以教导神经网络人类语言的运作方式”。
Anthropic声称其行为“对原告的受版权保护作品的合法市场没有‘实质性不利影响’”,指出歌词仅占训练数据的“微小比例”,并且所需的许可规模是不兼容的。
与OpenAI一样,Anthropic声称许可训练神经网络如Claude所需的大量文本是在技术和财务上不可行的。对于任何一方来说,跨流派训练数以万计的片段可能是一个难以实现的许可规模。
文件中最新颖的论点或许是,原告们自己,而不是Anthropic,参与了关于产出侵权责任的“主观行为”。
在版权法中,“主观行为”是指被指控侵权的人必须被证明对侵权内容输出具有控制权。在这种情况下,Anthropic基本上是说,唱片公司原告们导致其AI模型Claude生成侵权内容,并因此对他们报告的侵权行为负有控制和责任,而不是Anthropic或其Claude产品,后者对用户输入做出自主反应。
文件指出,产出是通过原告们对Claude进行的“攻击”而生成的,这些攻击旨在引出歌词。
除了对抗版权责任外,Anthropic坚持认为原告不能证明不可弥补的损害。
Anthropic指出,没有证据表明自Claude推出以来歌曲许可收入有所减少,或者质量上的伤害是“确定和立即的”。Anthropic指出,出版商们自己认为金钱赔偿可以弥补损失,这与他们声称的“不可弥补的损害”相矛盾(因为根据定义,接受金钱赔偿将表明这些伤害是有价格可量化且可以支付的)。
Anthropic主张对其及其AI模型的禁令是不合理的,因为原告在证明不可弥补的伤害方面表现疲软。
它声称音乐出版商的要求过于宽泛,不仅试图限制本案中的500个代表作品的使用,还试图限制数百万其他由出版商声称控制的作品的使用。
此外,这家AI初创公司指出,该诉讼是在错误的司法管辖区提起的。Anthropic坚称其与田纳西州没有相关的业务联系。该公司指出,其总部和主要运营地点位于加利福尼亚州。
在生成式人工智能行业的版权战争继续加剧。越来越多的艺术家加入了对诸如Midjourney和OpenAI的艺术生成器的诉讼,从扩散模型的重建中增强了侵权的证据。最近,《纽约时报》对OpenAI和微软提起了版权侵权诉讼,声称它们使用抓取的时报内容来训练ChatGPT和其他人工智能系统的模型违反了其版权。该诉讼要求数十亿美元的赔偿,并要求销毁任何受时报内容训练的模型或数据。
在这些争论中,一个名为“Fairly Trained”的非营利组织本周发起,倡导为用于训练人工智能模型的数据提供“有牌照的模型”认证。各大平台也加入其中,包括Anthropic、Google和OpenAI以及Shutterstock和Adobe等内容公司承诺为企业用户提供人工智能生成内容的法律辩护。
尽管如此,创作者们并不气馁,他们对OpenAI等公司的作者的索赔驳回提出抗议。法官们将需要在复杂的争端中权衡技术进步和法定权利。
此外,监管机构对数据挖掘范围的担忧正在引起关注。诉讼和国会听证会可能决定公平使用是否能够庇护专有挪用,这让一些人感到沮丧,同时使其他人受益。总体而言,协商似乎是不可避免的,以满足生成式人工智能不断发展中的所有利益相关方。
未来的走向尚不明确,但本周的文件表明,生成式人工智能公司正在围绕一套核心的合理使用和基于伤害的辩护方案形成共识,迫使法院权衡技术进步与权利所有者控制之间的关系。正如VentureBeat先前报道的,迄今为止,在这类AI争端中没有版权原告赢得初步禁令的先例。Anthropic的论点旨在确保这一先例至少在众多正在进行的法律战斗的这个阶段持续存在。