广告
图片生成中,请稍候...

Anthropic与Meta的“合理使用”裁决对比:美国48小时内的AI版权司法裂痕

文章摘要:两起AI训练版权案在加州48小时内接连宣判,结果看似一致却暗藏分歧。法官均认定AI训练属“合理使用”,但逻辑迥异、漏洞频出,尤其对“转化性”和“市场影响”的理解存在根本分歧。一边将AI学习类比人类阅读,另一边强调其指数级替代风险;一边为盗版开绿灯,一边坚决反对。判决虽窄限于个案,却暴露出美国版权法在AI时代的巨大裂痕。

自几年前人工智能技术兴起以来,受版权保护的作品是否可以自由用于训练生成式人工智能模型一直是数十起诉讼的核心问题。上周,美国地方法院宣布了两项关于Anthropic和Meta的判决,将合理使用抗辩应用于人工智能训练,初步解答该问题的意见,然而这两个决定的矛盾性质说明,要真正解决这个问题,还有很长的路要走。

序章:加州48小时内的“合理使用”双判

2025年6月23日,加州北区地方法院法官William Alsup就Bartz v. Anthropic(以下简称Anthropic案)作出了简易判决。此案提交不到一年,且证据开示仍在进行中。在证据开示完成之前就做出简易判决的情况非常罕见,因为可能存在一些尚未记录的事实,而这些事实可能会影响判决结果。

在Anthropic案宣布裁决后不到48小时后,第二起AI版权合理使用案件Kadrey v. Meta(以下简称Meta案)就得到了判决。该案也在加州北区法院审理,由另一位法官Vincent Chhabria做出了有利于Meta 的即决判决。虽然Chhabria法官认为Meta的使用属于合理使用。

尽管事实上这两起案件都是在同一个地区法院几天之内判决的,而且都裁定Meta和Anthropic的AI 训练属于合理使用,但这些案件的判决截然不同,也并非像某些报道所称的那样,完全是AI公司的“胜利”。

带裂痕的共识:法官们“合理使用”认定的共同点

转换性使用”的模糊边界

两位法官都认定,根据第一项合理使用因素,将受版权保护的作品用于人工智能训练属于转化性使用。他们还都得出结论,第一项合理使用因素对人工智能公司被告有利。

Anthropic案的Alsup法官基于以下三点考虑判定该使用属于转化性使用:(1)输出不侵权;(2)人工智能训练与人类学习类似;(3)人工智能是改变游戏规则的技术(即具有“变革性”)。笔者认为,Alsup法官完全依赖这些因素是极其错误的。

Meta案的Chhabria法官对转化性使用和第一个合理使用因素的分析比Alsup法官的分析好得多,但同样存在一个主要缺陷,即错误地关注和重视原告需要证明人工智能系统的输出与原告的作品实质相似。实质相似是侵权的检验标准,而不是合理使用的标准。两种使用“目的的相似性”才是合理使用的检验标准。

这两项判决的另一个共同点是,两位法官对转化性使用的分析都没有讨论用于确定转化性使用的实际法律标准。根据判例法以及最高法院最近在Warhol v. Goldsmith案(以下简称Warhol案)中的判决,一种使用不能仅仅因为产生了新的和创新的东西就具有转化性。要具有转化性,使用必须有正当理由,即(1)促进版权目的的实现,而不会损害所用作品的市场;(2)使用者必须证明使用该作品对于实现此目的而言是必要的。但这两个裁决都没有承认Warhol案的这一关键指标。

复制的是“表达”而非“功能”

两位法官均承认,这些书籍因其受版权保护的表达方式而对人工智能训练具有价值,并驳回了人工智能公司声称其仅使用了书籍中“功能性元素”或“非表达性元素”的主张。

Alsup法官表示:“Anthropic之所以高度重视这些书籍,是因为它们的数据融合了作者所著的书籍,并且它们的价值在于其中包含的创造性表达”,并且“之所以选择纳入训练集,是因为它们内容完整,并且包含丰富的受保护表达方式。”

Chhabria法官驳回了Meta的论点,即其“仅使用原告的书籍来获取其‘功能性元素’,而非利用其创造性表达”,并解释说:“Meta对原告书籍的使用确实取决于书籍的创造性表达。”正如Meta本身所指出的,LLM的培训是通过学习“词汇和概念之间的统计关系”以及收集“关于词序、频率(使用哪些词汇以及使用频率)以及语法和句法的统计数据”来实现的。词序、词汇选择、语法和句法是人们表达思想的方式。

“许可市场”论证的循环陷阱:对新兴市场的刻意忽视?

第四个合理使用因素——使用对实际和潜在市场的影响,无疑是四个因素中最重要的。尽管如此,在两项判决中,第四个因素中关于直接许可市场的考虑几乎都不存在。两位法官几乎没有给出任何实质的分析,就认定不存在市场损害,因为版权所有者在法律上无权进入人工智能训练市场。

Alsup法官关于许可市场的讨论仅仅指出,“一个新兴的、以狭隘培训目的授权作品的市场……并非《版权法》赋予作者利用的市场。”他没有对这一结论做出任何解释。Chhabria法官的讨论甚至更短,他仅用两句话就得出结论:“为了防止第四个因素的分析陷入循环论证,并在所有案件中都偏袒权利人,因作品用于转换性目的而支付的许可费用损失造成的损害不予认定。”

两位法官忽略了一个重要的现实:一个蓬勃发展的新兴人工智能训练材料许可市场已经存在。第四个因素下的许可市场只有再被认为是一个潜在的许可市场,并且法官试图确定该潜在市场是否过于投机时,才可能是循环的和不可认知的。但是,当一个实际存在的市场已经存在时,循环论证就站不住脚了,两位法官草率地声称该论证是循环的,笔者认为是错误的,法官才是进行循环论证的人。

判决的“狭窄性”:仅限于本案特定事实

两位法官都明确表示,他们的判决非常狭隘,仅限于他们的这一案例。例如,两位法官都明确表示,如果输出内容相似或侵权用途不同,他们的判决可能会完全不同。因此,这两个案件的判决或许不会对原告已经证明输出内容相似或侵权用途不同的案件产生不利影响——例如Concord诉Anthropic案、NYT诉OpenAI案、Getty诉Stability AI案和Disney诉Midjourney案以及许多其他案件。

Chhabria法官进一步缩小了Meta案裁决的影响,他指出:“绝对没有规定说,当你使用受保护的作品‘具有变革性’时,就自动使你免于被指控侵犯版权。”并且“这项裁决并不主张Meta使用受版权保护的材料来训练其语言模型是合法的,仅主张这些原告提出了错误的论点,并且未能提供支持正确论点的记录。”

事实上,Chhabria法官的命令已被许多人认可,为版权所有者如何赢得人工智能侵权案件提供了路线图。

司法逻辑的对撞:两案裁决的核心分歧点

AI训练=人类学习?

在Anthropic案的整个判决过程中,Alsup法官反复将人工智能训练与人类学习进行比较,以证明其关于第一个合理使用因素下的转化性使用,和第四个合理使用因素下的许可市场的结论。事实上,Meta案的Chhabria法官强烈批评Alsup法官将人类学习与人工智能训练进行比较的做法,他表示:“用书本教孩子写作,与用大量书籍创造一种产品截然不同。通过这类产品,一个人只需投入极少的时间和创造力,就能创作出无数相互竞争的作品。这种不恰当的类比并不能成为忽视合理使用分析中最重要的因素的依据。”

在Meta案判决书中,Chabbria法官批评了Alsup法官的不当比较:

LLM的书籍阅读体验与人类不同。LLM 会吸收文本,学习词语在不同语境下如何组合使用的“统计模式”。它通过从训练数据中提取一段文本,从中删除一个单词,预测该单词的含义,并根据其正确性更新其对语言的总体理解——然后用不同的文本重复这个过程数十亿甚至数万亿次。这与人类阅读书籍的方式不同。

与(Alsup法官提到的Anthropic案中)假设的教授不同,Meta并非仅仅将原告的书籍提供给一个人。任何人都可以使用该工具来帮助他们进行进一步的表达,无论是通过帮助其进行头脑风暴或研究创意写作项目(例如原告David Henry Hwang,一位剧作家兼编剧),还是通过编写代码来开发新的软件程序(例如洛克希德·马丁公司)。通过创建一种任何人都可以使用的工具,Meta的抄袭行为有可能以指数级的方式成倍地增加创造性表达,而教授个人则无法做到这一点。

可见,Alsup法官和Chhabria法官在人类学习和AI训练问题上的分歧很大。

第四因素焦点:市场稀释风险是否“核心威胁”?

两位法官意见分歧的另一个方面是如何在第四项合理使用要素下处理市场稀释问题。

在Anthropic案中,Alsup法官再次大量引用人类学习类比表示:“作者的投诉与他们抱怨训练小学生提高写作水平会导致竞争作品激增的情况并无不同。这并非《版权法》所关注的那种竞争性或创造性的取代。”他未作任何真正考虑便轻率地否定了间接替代所造成的市场稀释带来的损害。

相比之下,Chhabria法官就可能损害版权所有者实际和潜在市场的间接替代影响进行了非常深入的讨论。他解释说:

生成式人工智能有可能为市场带来海量的图像、歌曲、文章、书籍等等。人们只需投入极少的时间和创造力,就能促使生成式人工智能模型生成这些输出。因此,通过使用受版权保护的作品来训练生成式人工智能模型,企业所创造的东西往往会极大地破坏这些作品的市场,从而极大地削弱人类以传统方式创造事物的动力。

“本案……涉及一项技术,它能够生成数百万个次级作品,而其投入的时间和创造力,却远不及创作原作。任何其他用途——无论是创作单个次级作品,还是开发其他数字工具——都不可能像LLM培训那样,让市场充斥着竞争性作品。因此,市场稀释的概念变得至关重要。”

Chhabria法官似乎在此案中提出了更强有力的论点。第九巡回法院是否会采纳他的观点还有待观察,但显而易见的是,与Alsup法官采取的更为平淡的路线不同,Chhabria法官理解并意识到,人工智能技术的出现及其对版权激励机制(即创作和分发新的受版权保护的作品供公众欣赏)的影响规模,需要采取更周全的、更符合版权精神以及合理使用抗辩的审理方式。

盗版材料的“原罪”:使用非法来源是否自动丧失合理使用资格?

两案判决的另一个重要差异在于,对影子图书馆(例如Z-Library和Books3)盗版作品的使用考量。

在Meta案中,Chhabria法官豁免了Meta对影子图书馆盗版作品的使用,因为:(1)没有证据表明Meta的行为“使这些图书馆受益或使其非法活动得以延续——例如,他们从Meta访问其网站中获得广告收入”;(2) Meta最终将它们用于人工智能训练目的,而他认为这是一种转化性用途。即只要被告能够证明盗版在某个环节被用于符合合理使用目的,就免除其大规模盗版行为的罪责。笔者认为,这与允许某人因需要家中药物而入室行窃并无太大区别。

Alsup法官对Anthropic使用来自非法网站和服务的盗版作品构建数字图书馆的案件采取了截然不同的解读,认为此类行为使Anthropic丧失了成功进行合理使用抗辩的资格。Alsup法官驳斥了使用盗版作品可以构成合理使用的观点,并通过以下陈述明确指出:“即使盗版作品被立即用于转化性使用并立即丢弃,盗版原本可获得的副本本质上也构成了不可挽回的侵权行为”以及“Anthropic错误地认为,只要创作出令人兴奋的最终产品,所有‘公众看不到的后端步骤’都可以被免责”。

这些意见虽然意义重大,但并不意味着这两个案件的终结。美国第九巡回法院如何处理这些差异应该会非常有趣,但在此之前,美国版权法将陷入一片混乱。

本文来自微信公众号 "互联网法律评论",由AI智榜收集发布,撤稿请联系运营。
你也想被收录?加客服微信:tongzi3166,把公号文章链接发给客服就OK了。免费、高效、快速 ^_^
广告