AI模型训练使用他人作品构成合理使用吗？

作者：何京张维嘉周燕丽来源：北京植德律师事务所时间：2023-07-12

近期，一家图片提供商在美国和英国两地起诉了一个热门的人工智能（“AI”）绘画工具的开发者Stability AI，称其侵犯了版权，因为他们“非法”地从权利人网站上窃取了数百万张图片来训练AI模型；此外

近期，一家图片提供商在美国和英国两地起诉了一个热门的人工智能（“AI”）绘画工具的开发者Stability AI，称其侵犯了版权，因为他们“非法”地从权利人网站上窃取了数百万张图片来训练AI模型；此外在美国还发生了起诉AI开发者的集体诉讼，一群艺术家起诉了Stability AI等公司，指控他们未经原作者同意从网络上获取50亿张图像来训练其AI模型，侵犯了数百万艺术家的权利[1]。
像Stable Diffusion[2]这类的人工智能创作工具，其在AI训练的过程中必然会使用他人的作品，那么使用他人作品作为AI训练过程中的训练素材，是否可以构成著作权法上规定的“合理使用”呢？如果可以构成“合理使用”，则使用他人作品进行AI训练即不需要事先获得著作权人的许可，反之，则前述AI训练活动就需要获得著作权人的许可。这是AI创作领域的一个关键性问题。
本文的观点是：在四要素框架下，AI模型训练过程中对他人作品的使用可构成合理使用。
一、生成式AI
生成式AI为了解决问题或完成任务，通过“学习”大量的材料，例如图像、音频或文本，使AI工具具备“创作”能力，生成新的内容。
在图像生成AI领域，这类算法模型，利用数百万乃至数十亿的图像进行深度学习，从而生成全新的图像。值得注意的是，大部分图像生成模型，很可能是使用未经作者授权许可的图像集进行训练的。
因此，必然引发权利人对AI工具的侵权控诉，那么，AI工具开发者的合理使用抗辩是否能够成立呢？
二、“合理使用”制度
各国的著作权法在规定未经许可不得使用他人作品的著作权保护规则的同时，也都规定了在某些特定情况下可以不经许可使用作品的“合理使用”情形。
中国的著作权法目前对“合理使用”的情形是采取“封闭式列举”的形式进行规定，但是在《80后的独立宣言》案[3]中已经有突破“封闭式列举”的判例。
美国版权法第107条的合理使用制度被视为保障版权作品的使用不受权利人阻止的重要机制，该机制允许的合理使用情况通常包括批评、评论、新闻报道、教学、学术研究以及其他一些涉及公共利益的使用。与中国著作权法封闭式列举“权利的限制”的方式不同，美国版权法第107条规定了合理使用的四个考量因素：使用的目的和性质，受版权保护作品的性质，使用版权作品的数量和质量，使用对版权作品潜在市场或价值的影响。美国法院在个案中通常会立足于版权法的目的和目标，综合四个因素判断具体行为是否属于合理使用。
下文将借鉴美国版权法中判定合理使用的四要素逐一分析AI模型训练对作品的使用。
三、AI模型训练对作品的使用构成合理使用
（一）使用的目的和特性—AI模型训练对作品的使用构成转换性使用
1.产生新的表达或另有新的意义或用途的情况下构成转换性使用
该因素会考虑对作品的使用是出于商业目的还是非营利目的，商业目的的使用可能不利于主张合理使用，但商业性只是该因素分析的一部分，通常要结合转换性使用进行判断。
转换性使用通常指二次使用不是为了再现原作品本身的文学、艺术价值或者实现其内在功能或目的[4]，而是产生了新的表达或另有新的意义或用途，比如评论、研究或教育。一旦构成转换性使用，往往更容易被认定为构成合理使用。
美国的许多合理使用案件中，具有决定性因素的往往是转换性使用。
在谷歌图书案(Authors Guild, Inc. v. Google Inc)[5]中，谷歌将数千本印刷书籍的副本数字化并储存，创建一个可搜索的文本数据库。其目的并非使用这些书的内容，而是创建一个数字工具，使人们快速搜索到想要找的书籍。这种使用具有新的目的和用途，因此被法院认定属于“转换性使用”，从而构成合理使用。
甲骨文与谷歌案（Google llc v. Oracle America, Inc）[6]中，甲骨文起诉谷歌未经许可使用了Java语言的API（应用程序接口）的部分代码，这些代码被谷歌用于开发Android系统。2021年，美国最高法院以6-2的投票结果，认定谷歌对Java代码的使用属于合理使用。首先，法院认可了新技术发展的重要性，明确表示合理使用应在技术发展背景下进行考虑。其次，法院极大地认同了转换性使用的原则，即如果使用方式能够为被使用的作品赋予新的创造性价值，那么这种使用就应该被认为构成合理使用。本案中谷歌对代码的使用方式，主要是为了建立新的创造性作品（即Android系统），而这正是版权法鼓励和保护的。
在Kelly诉Arriba Soft[7]案与Perfect10诉Amazon案[8]中，搜索引擎运营商Arriba Soft与Amazon都是将缩率图用于图片搜索，以此提高用户获取网上信息的效率，而非使用图片本身的美学价值，均被认定构成转换性使用。
以上案例中，法院都认为二次使用与原作品的创作目的截然不同，构成转换性使用，从而支持了合理使用抗辩。
2.二次使用与原作品的目的高度相似且具有商业性质的情况下不构成转换性使用
2023年5月18日，美国最高法院对安迪·沃霍尔视觉艺术基金会公司诉戈德史密斯案[9]（Andy Warhol Foundation, Inc. v. Goldsmith）作出判决。
1981年，戈德史密斯受雇于美国《新闻周刊》拍摄了一系列当时新兴歌手普林斯的照片。后来，沃霍尔基于这些照片创作了丝网印刷照片，沃霍尔去世后，安迪·沃霍尔视觉艺术基金会（“AWF”）接管了沃霍尔的这些作品。2016年，普林斯去世后，《名利场》的母公司康泰纳仕希望使用这些丝网印刷照片来纪念普林斯，于是与AWF签订了许可协议。
2016年，戈德史密斯知道AWF使用了普林斯丝网印刷照后，通知AWF侵权。然而，AWF反过来将戈德史密斯起诉到地区法院，抗辩构成合理使用，希望判决其行为不构成侵权。之后戈德史密斯反诉AWF侵权。
一审法院认为AWF的行为是合理使用，不构成侵权。戈德史密斯不服，上诉至上诉法院。上诉法院认为AWF的行为不构成合理使用，侵权成立。AWF不服，申请美国最高法院审理。美国最高法院以7：2的比例做出判决，认为AWF的行为不是合理使用，侵权成立。
最高法院多数法官意见关注的是对原作品的使用目的和性质，认为原作品和二次使用的目的高度相似且具有商业性质的情况下，不能构成合理使用。而少数法官意见认为应更多地考虑到作为创作者对知识和艺术领域的贡献和创新，他们认为沃霍尔的创作构成了“转换性使用”，并认为严格的版权制度会限制艺术创新。
该案件在美国引起了激烈的讨论，大部分观点认为本案中对商业目的以及对原作品市场的影响的过分考量对于AI模型创作者和支持者的观点是极为不利的[10]。沃霍尔基金案极大地限缩了合理使用的范围，这与2021年在甲骨文与谷歌案中法官对转换性使用的宽松判定完全不同。
但是，本案不会在根本上改变美国对合理使用的认定。沃霍尔基金案对于合理使用的分析极为具体，法院的裁决主要集中在对“使用”一词的解释上，特别是在案件中特定商业环境中的含义，即AWF将丝网印刷照片许可给杂志的使用行为与戈德史密斯拍摄人物照片具有相同的商业目的，而非全面考量合理使用的四个因素。这一裁决对“合理使用”解释限制在比较狭隘的范围内，这反而为使用性质和目的与原作存在较大区别的转换性使用提供了更大的可能性。此外，尽管此案例特别关注AWF使用行为的商业性，且分析了使用对原作品市场的影响，但本案的特殊性在于沃霍尔基金的图片使用方式和市场与原作者作品高度重合。因此本案例并不能改变AI模型训练中对作品合理使用的理解和判定。
3.AI模型训练构成转换性使用
将AI模型的训练过程视为转换性使用的关键在于AI处理和理解受版权保护的作品的方式。
以Stable Diffusion为例，其采用的LAION数据集并未直接包含图像，而是包含了超过50亿个“图像-文本对”的网络链接。在此过程中，Stable Diffusion模型通过添加“噪音”破坏和消除破坏，并用另一个工具CLIP理解文本与相应图像的关系，最后将类似的数据聚集在一起。这些模型并未保留训练数据中的图像副本，而是构建了一个对基于训练数据的图像表征模型。
在合理使用的考量中，这种方法有着明显的转换性目的，因为这种使用方式将“图像-文本对”用作训练数据，并未直接使用原始图像的美学价值。对于AI模型而言，这些“图像-文本对”只是代表了文本和图像之间的关系的数据，而并不关注它们本身，它们对模型来说只是教授模型了解图像元素之间关系的数据，而非具有美学价值的艺术作品。
总之，在AI模型训练过程中，AI是将受版权保护的图像作品看作是一种数据而不是艺术作品用于训练模型。模型需要理解和学习文本和图像之间的关系，而不是图像本身的艺术价值。这种使用方式可以被视为“转换性”的，因为它的使用目的和方式与原作品的艺术目的和形式完全不同。
（二）受版权保护作品的性质
这一因素主要考虑的是原作品的类型和创新性。一般来说，虚构作品或者完全出自作者创新的作品享有更高的版权保护。
用于AI模型训练的作品通常包含大量创新性作品，如摄影作品，美术作品。因此，这个因素可能倾向于否定合理使用，但这一因素在合理使用的判断中往往不是决定性的。此外，这些作品在AI模型训练中是被视为数据或一种学习模式的资源，而非艺术作品。尽管创新性作品在此环境中的使用可能对合理使用的认定产生影响，但也应考虑到AI模型训练的使用目的并非是为了欣赏这些作品的创新性，而是作为训练数据。
（三）使用版权作品的数量和质量
1.“全部复制”在某些情况下也可以构成合理使用
使用的数量和质量通常是与原作品相比的，考量这一因素的理由在于复制原作品的数量越多，二次使用成为原作品竞争替代品的可能性越大，对权利人的影响越大。在评估这个因素时，法院会考虑是否复制的比例以及复制的比例是否符合二次使用的转换性目的。如果复制的目的属于转换性使用且复制比例是达成该目的所必须的，即便是复制了整个作品，也可能被视为合理使用。
在谷歌图书案中，法官强调了谷歌对图书全部复制的目的是为了转换性目的—提供搜索功能，这种整体复制是为了实现该目的所必要的，如果谷歌复制部分原作品，则可能无法可靠地告诉用户，他们的搜索关键词是否出现在一本书中，或者出现多少次。
大多数AI模型的训练确实涉及到对海量版权作品的全部复制，这种复制是AI学习的过程，是为了让AI模型能够理解图像和文本之间的复杂关系，这一目的不同于原作品的美学功能。而且，这种大量且完全的复制是为了实现AI 模型得到有效训练所必须的。所以在构成转换性使用的基础上，合理必要的复制是法律所允许的。
此外，在谷歌案图书案中，法官还强调了对该因素中具有决定性影响的应是用户能看到的复制部分的内容，谷歌虽然复制了整本书，但只向用户展示了其中的“片段”，展示的片段不足替代原作品，没有构成对原作品的实质性替代。而在AI模型训练过程中，AI模型不会向用户直接展示或者传播复制的内容，所以即使全部复制也应构成合理使用。
2.AI模型进行了全部复制，但属于过渡性复制，构成合理使用
在某种程度上，AI模型训练过程中的复制行为可以被视为“过渡性的”，因为它们不会以原始形式存在于AI模型的数据集中，也不会储存在最终的AI模型中，只是作为过程材料的训练数据。
像Stable Diffusion和Midjourney这样的模型，虽然在训练过程中可能会使用整个图像，但他们不会向用户提供任何一个原作品图像。相反，它们学习了图像和文本之间的关系，并据此生成新的图像。
因此，尽管AI模型在训练过程中可能会使用大量的版权作品，但这并不构成对这些作品的实质性使用，因为AI模型并不会存储或向用户传播这些图像，而是把这些作品看作一种资源，通过学习这些作品中的模式来理解图像和文本之间的关系，这属于过渡性且具有转换性目的的复制行为。
（四）使用对版权作品潜在市场或价值的影响
1.二次使用是否对原作品的市场产生了不利影响
这个因素主要关注二次使用是否破坏了原作品的市场或作为原作品的市场替代品。如果二次使用显著破坏了原作品的市场，或实质性替代原作品的市场，那么该使用很可能不会被视为合理使用。
在美国的司法实践中，通常会重点考虑第一个因素和第四个因素，这两个因素是密切相关的。转换性使用作为第一因素中重点考虑的问题继而影响第四个因素的判断，美国最高法院在"Campbell v. Acuff Rose"[11]案中指出，一个作品对原作品的利用越具有创造性，也即转换性程度越高，那么它和原作品存在市场替代的可能性就越低，这样转换性作品不合理地损害版权人的合法权益的可能性就越小。而且如此一来，是商业还是非商业性质的使用就显得不那么重要了。因为即使使用是商业性质的，如果是补充关系或者不构成替代关系，就不存在竞争，进而不会造成原著作权人潜在市场的不利影响。
2.AI模型训练使用原作品不会破坏原作品的市场
AI模型训练存在于一个与原作品完全不同的市场中，它并未篡夺原作品的市场，也未作为市场替代品，因为原作品并不存在于数据市场中。此外，AI模型将作品作为训练数据的使用，并未取代原作，也并未与原作品在审美市场上竞争。
AI模型生成的图片可能会影响原作者的作品市场，这可能会否定合理使用。但生成图片已经不属于训练内容，而是输出内容，这些内容产生的版权问题需要另外讨论。[12]
小结
在中国的司法实践中，也有适用美国“合理使用”四要素，得出使用原作品构成合理使用的在先案例；在AI模型训练过程中对作品的使用构成合理使用在中国法下具有讨论的空间。这样的讨论将有益于人工智能产业的创新和发展。
[1]https://www.reuters.com/legal/transactional/lawsuits-accuse-ai-content-creators-misusing-copyrighted-work-2023-01-17/
[2]Stable Diffusion是图像生成模型，由初创公司 Stability AI 和慕尼黑大学机器视觉学习组和 AI 视频剪辑技术创业公司 Runway 合作开发。
[3]案号：上海知识产权法院(2015)沪知民终字第730号，裁判时间：2016.04.25
[4]王迁，《电子游戏直播的著作权问题研究》，载《电子知识产权》2016年第2期。
[5]Authors Guild v. Google, Inc., 804 F.3d 202, (2d Cir. 2015)
[6]Google llc v. Oracle America, Inc., 593 U.S., 141 S. Ct. 1183 (2021)
[7]Kelly v. Arriba Soft Corp., 336 F.3d 811 (9th Cir. 2003).
[8]Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d 1146 (9th Cir.2007).
[9]Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 598 U.S. (2023).
[10]What the Warhol Ruling May Mean for AI - Plagiarism Today
[11]Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569 (1994)
[12]林秀芹.AI时代著作权合理使用制度的重塑[J].法学研究,2021,43(06):170-185.