总第147期 生成式人工智能的著作权挑战与合规框架构建

编者按

在当今数字化时代,生成式人工智能(AI)技术正以前所未有的速度改变着内容创作的格局。从文本创作到图像生成,从音乐编排到视频制作,AI的应用为内容创作带来了前所未有的便利和效率提升。然而,这一技术的革新也伴随着一系列复杂的法律问题,尤其是在著作权领域。作为知识产权律师,我们深知著作权保护对于鼓励创新、维护创作者权益的重要性。因此,深入探讨生成式AI在著作权方面面临的挑战及合规问题,不仅关乎技术的健康发展,更涉及法律框架的适应与创新。本文旨在全面分析生成式AI在著作权领域所遇到的关键挑战,探讨构建合规框架的可能路径,以期为法律实践提供有益的参考和指导。

作者:北京海润天睿律师事务所 姜向阳 潘永寿

一、生成式人工智能面临的著作权挑战

(一)训练数据的合法性争议

AI训练需使用大量受著作权保护的作品,未经授权的数据使用可能侵犯复制权、改编权等。即使生成内容与训练数据差异显著,仍存在侵权风险。合理使用制度在AI场景下适用困难,需综合考量使用目的、性质及对原作品市场的影响。

1. 侵权?

AI在训练过程中需要使用大量受著作权保护的作品作为训练数据,这可能涉及对复制权、改编权等权利的侵犯。即使AI生成的内容与训练数据有显著差异,仍可能存在侵权风险。此外,AI生成内容若复制了训练数据中的受保护表达,可能构成侵权。如何界定AI创作过程中的侵权边界,成为亟待解决的法律难题。

案例分析:AI训练数据使用与著作权侵权

“奥特曼案”

在“奥特曼案”中,被告利用AI技术生成了与奥特曼动漫形象高度相似的图片。原告(奥特曼版权方)认为,被告的行为侵犯了其著作权,特别是信息网络传播权和改编权。法院认定被告的行为构成侵权,主要基于以下几点:

(1)复制权的侵犯:AI在生成图片时,使用了受版权保护的奥特曼形象作为训练数据,这可能涉及对原作品的复制。即使生成的内容与训练数据有显著差异,只要AI在训练过程中未经授权使用了受保护的作品,就可能构成对复制权的侵犯。

(2)改编权的侵犯:AI生成的图片与奥特曼形象高度相似,可能被视为对原作品的改编。改编权是指对原作品进行修改、翻译、注释等创作性演绎的权利。未经授权的改编行为同样构成侵权。

(3)信息网络传播权的侵犯:被告将生成的图片通过网络传播,可能侵犯了原告的信息网络传播权,即通过信息网络向公众提供作品的权利。

该案明确了AI生成内容若与受保护作品高度相似,可能构成侵权。即使AI生成的内容具有独创性,只要其训练数据未经授权使用,仍可能面临侵权风险。同时,该案引发了对AI训练数据使用合法性的广泛讨论。如何在保护著作权的同时,促进AI技术的发展,成为亟待解决的法律难题。

北京互联网法院AI绘画大模型训练著作权侵权案

2024年6月20日,北京互联网法院开庭审理了全国首例涉及AI绘画大模型训练著作权侵权案。该案的核心争议在于,AI训练过程中使用大量受著作权保护的作品是否构成侵权。

案件焦点问题如下:

(1)训练数据的合法性:原告主张,被告在训练AI模型时未经授权使用了大量受著作权保护的作品,侵犯了其复制权和改编权。

(2)生成内容的侵权风险:即使AI生成的内容与训练数据有显著差异,只要训练数据未经授权使用,仍可能构成侵权。

(3)合理使用的抗辩:被告可能主张其使用行为构成合理使用,即基于非商业目的、对原作品市场影响较小等理由,主张不构成侵权。

该案进一步探讨了AI训练数据使用是否构成合理使用。合理使用制度旨在平衡著作权保护与公共利益,但在AI训练数据的场景中,其认定需要综合考虑使用目的、性质、程度以及对原作品市场的影响等因素。同时该案还可能涉及AI开发者、使用者及平台的责任划分。如何在现有法律框架下明确各方的法律责任,成为该案的重要议题。

AI生成内容的侵权边界尚未完全明确。即使生成内容与训练数据有显著差异,只要训练数据未经授权使用,仍可能构成侵权。因此,AI开发者在使用训练数据时,需确保数据来源合法,避免侵犯他人著作权。而且,AI训练数据的使用是否构成合理使用,仍存在较大争议。合理使用的认定需要综合考虑多种因素,包括使用目的、性质、程度以及对原作品市场的影响等。

随着AI技术的快速发展,现有法律框架在应对AI生成内容的著作权问题时存在局限性。未来,需进一步完善相关法律法规,明确AI生成内容的可版权性、权利归属及侵权认定标准,以平衡技术创新与著作权保护之间的关系。

通过这两个案例的分析,我们可以看到,AI训练数据的使用与著作权保护之间的冲突日益凸显。如何在保护创作者权益的同时,促进AI技术的健康发展,成为当前法律实践中的重要课题。

2.合理使用?

未经授权使用他人著作权作品训练AI是否构成合理使用,是一个复杂且具有争议的问题。合理使用制度旨在平衡著作权保护与公共利益,促进知识的传播和创新。然而,AI训练数据的使用涉及大量作品的复制和改编,这与传统合理使用的场景有所不同。

合理使用是指在特定条件下,法律允许他人自由使用享有著作权的作品,而不必征得权利人的许可,也不向其支付报酬的合法行为。合理使用必须具备以下条件:

● 使用的作品已经发表;
● 使用的目的通常限于个人学习、研究、评论、新闻报道、教学等非商业性目的;
● 不得影响作品的正常使用;
● 指明作者姓名和作品名称;
● 在合理使用的范围内,不需要向著作权人支付报酬。

在AI训练数据的场景中,合理使用的认定需要综合考虑使用的目的、性质、程度以及对原作品市场的影响等。未经授权使用他人著作权作品训练AI,通常难以构成合理使用,特别是在商业使用场景中。随着AI技术的发展,相关法律和政策的完善也显得尤为重要。

值得一提的是美国和新加坡,在美国,针对AI训练数据的版权纠纷中,法院区分了输入与输出,判定仅使用版权数据训练不构成侵权,除非输出内容实质性相似。2021年,新加坡明确AI可在特定条件下使用版权数据进行机器学习训练,旨在吸引AI公司并提供法律确定性。美新两国法律在此方面的趋同,为全球AI行业提供了重要参考,有助于平衡技术创新与版权保护,减少法律风险,促进AI技术全球发展。

(二)生成内容的可版权性争议

全球对AI生成内容是否构成“作品”存在分歧:

1. 中国:承认AI生成内容可具备独创性,归属用户或开发者。

在中国,法院已在“春风送来了温柔”和“伴心”两起案件中,明确认定AI生成的图片构成著作权法意义上的美术作品,具有独创性,应受著作权法保护。这一立场体现了中国法院对于AI生成内容创新性的认可,并强调了著作权归属于相关权利人(如原告)的原则。然而,这一观点在国内乃至国际上均存在争议,反对者理由各异。

2. 欧洲:强调自然人创作核心,AI生成内容通常不受保护。

与中国的立场不同,欧洲法院在捷克一起涉及AI与版权的纠纷中,认定AI生成的作品不受版权法保护。该裁决指出,由于AI不是“自然人”,根据欧洲版权法,它不能成为作品的创作者。此外,欧洲法院还认为AI生成的作品不构成“作品”,因为不是自然人创造性活动的独特结果。然而,该裁决也暗示,如果提供给AI工具的指令能够体现人类作者的独创性,那么AI生成的作品或许可以受到版权保护。

3. 美国:要求人类实质性控制,仅提示词不足以获得版权(如“太空歌剧院”案)。

2025年1月29日,美国版权局发布关于AI生成作品版权性的第二份报告,强调保护需“足够的人类控制表达元素”。仅凭提示不足以获得版权,但若人类输入原创作品且该作品在AI输出中可感知,则该部分可获版权。报告区分AI作为“协助”和“替代品”的情况,后者可能使作品失去版权保护。使用AI进行头脑风暴或初步创作不影响最终作品的版权性,但需确保AI输出未被直接合并。

人类作者的原创表达即使包含AI生成内容,仍可获版权保护。AI生成内容中的创造性选择、协调或修改需个案分析,申请人需详细说明其人类贡献。版权局的第三份报告将讨论AI模型训练、许可及责任分配等问题,对AI市场影响深远。

在具体案例中,中美两国在AI生成内容著作权保护上的差异得到了充分体现。例如,在我国北京互联网法院的文生图第一案中,AI生成的图像被认定为构成作品;而在美国版权局的“太空歌剧院案”中,尽管原告主张其在图像生成过程中进行了大量的智力投入,但版权局仍然认为该图像中包含的AI生成内容已超过最低限度,不能将其整体登记为作品。此外,美国发明家斯蒂芬·泰勒博士以人工智能DABUS创作的作品“天堂入口”向美国版权局申请注册也被驳回,理由是该作品被认为是由AI完全创作的。这些案例进一步凸显了中美两国在AI生成内容著作权保护上的不同立场和做法。

综上所述,人工智能生成内容的著作权可保护性问题在全球范围内均存在争议。各国法院和版权机构对此的认定方式存在差异,但普遍关注的核心问题在于AI生成内容是否具备独创性以及AI是否具有法律主体资格。未来,随着人工智能技术的不断发展和法律体系的不断完善,这一问题有望得到更加明确和统一的解答。

(三)权利归属的模糊性

1. 权利归属

现行著作权法主要针对人类创作者设计,难以直接适用于AI生成内容,归属争议集中在AI开发者、使用者及AI系统本身。目前,大多数国家的法律体系不承认AI系统具有法律主体资格。

(1)AI开发者:主张算法设计对生成结果有实质性影响。

AI系统的开发者通常是AI技术的创造者,他们投入了大量的资源和时间开发AI模型。如果AI生成的内容具有独创性,开发者可能主张对生成物享有著作权。特别是在AI生成内容的过程中,开发者可能通过算法设计、模型训练等方式对生成结果产生了实质性影响。

(2)AI使用者:若通过参数调整、内容编辑体现独创性,可能被视为作者。

AI生成物的使用者通常是提供指令或提示的个人或企业。如果使用者在生成过程中进行了大量的智力投入,如选择特定的参数、编辑生成的内容等,那么使用者可能主张对生成物享有著作权。特别是在AI仅作为工具辅助创作的情况下,使用者可能被视为生成物的作者。

(3)AI系统本身:当前法律普遍不承认其主体资格。

目前,大多数国家的法律体系不承认AI系统具有法律主体资格,因此AI本身不能成为著作权的主体。然而,随着AI技术的发展,部分学者主张应赋予AI一定的法律主体资格,尤其是在AI能够自主生成内容的情况下。这一观点尚未得到广泛认可,但未来可能会引发更多的讨论。

2. 为了更好地理解AI生成物著作权归属问题的复杂性,我们来看两个案例:

(1)“菲林案”:我国法院认为,AI生成的分析报告虽然具有一定的独创性,但由于其生成过程缺乏人类的创造性投入,因此不能被认定为著作权法意义上的作品。这一判决强调了人类创作在著作权保护中的核心地位。

(2)“腾讯案”:深圳南山区法院认为,AI生成的内容可以被认定为法人作品,其著作权归属于AI的开发者。这一判决表明,在某些情况下,AI生成物的著作权可以归属于开发者,特别是在生成过程中开发者对内容产生了实质性影响。

AI生成物的可版权性和权利归属是一个比较复杂的问题。从目前来看,首先在认定是否AI生成物是否具有可版权性上还在探索中,我国虽然已经有两个判例,但是学界对此争议很大。而从权利归属上来看,更多的是认为权利归属于输出指令的用户。

二、国内外生成式人工智能著作权问题的典型案例分析

国内外生成式人工智能面临的著作权问题主要是两方面,一是数据的来源,目前AI公司基本上都是未经授权使用他人的数据,另一方面,是人工智能生成物侵犯著作权。

(一)AI训练数据/未经授权的模型训练

AI公司因未经授权使用他人数据进行训练而频繁被诉。例如,法国监管机构对谷歌处以巨额罚款,因其在训练生成式AI模型时未经授权使用了大量受著作权保护的作品;国内也有画师起诉小红书AI大模型“Trik AI”侵权的案例。此外,美国唱片协会起诉AI音乐公司侵犯音乐著作权,加拿大媒体起诉OpenAI抓取内容训练大模型等案件,均凸显了AI训练数据侵权问题的严重性。这些案例表明,侵权问题在整个AIGC行业普遍存在,涉及文字、图片、视频、音频等各方面,随着AI大模型参数的增加,侵权风险将进一步加剧。

(二)AI生成物的侵权问题

AI生成物构成侵权的案例也屡见不鲜。例如,AI创作的画作《Edmond de Belamy》引发了著作权归属争议;新闻机构使用AI生成的新闻报道与他人报道高度相似,引发了侵权争议;还有AI生成的图片、文本、音乐等作品被认定侵犯他人著作权的案例。这些案例不仅反映了AI生成内容可能无意中复制受著作权保护材料的风险,也揭示了现有法律框架在界定AI创作过程中的侵权行为时的局限性。以下是部分典型案例:

1. AI生成艺术作品著作权纠纷

2018年,一幅由AI创作的画作《Edmond de Belamy》在佳士得拍卖会上以43.25万美元的价格成交。这幅作品的著作权归属引发了广泛讨论。AI的开发者声称拥有著作权,但一些人认为AI本身应当被视为作者。

而在Shein vs. Alan Giana一案中,知名多媒体艺术家Alan Giana指控中国快时尚巨头Shein【广州希音国际进出口有限公司的品牌】对其知识产权进行了“工业规模的系统性侵权”,即利用算法和人工智能(AI)识别第三方艺术家和设计师创作的流行作品或具有潜在知名度的作品,然后在未经版权持有人授权或未向其支付任何报酬的情况下进行复制。此次诉讼针对的是与Shein庞大的控股公司相关的多家企业,包括Roadget Business Pte., Ltd.、Shein Distribution Corporation、Shein Technology LLC以及Shein US Services, LLC。Giana诉Shein案实际上是一系列案件中的最新一起,这些案件凸显了Shein长期利用人工智能制造假冒产品的倾向。

2. AI生成文本的侵权争议

(1)新闻报道侵权案

2020年,一家新闻机构使用AI生成了一篇新闻报道,其中部分内容与另一家媒体的报道高度相似。被指控侵权的新闻机构辩称,AI是在独立学习大量数据后生成的内容,不存在故意抄袭。该案例反映了AI生成内容可能无意中复制受著作权保护材料的风险,以及如何界定AI创作过程中的侵权行为的难题。

(2)北京菲林律师事务所诉北京百度网讯科技有限公司侵害作品著作权案

北京某律师事务所在自己的公众号上发表了一篇名为“影视娱乐行业司法大数据分析报告”的文章。网民“点金圣手”在百度公司经营的内容发布、内容变现和粉丝关系平台“百家号”上发布了上述文章,且将文章的署名及收尾段进行了删除。某律所认为百度公司侵害了其著作权,遂将其诉至法院。北京互联网法院认为,虽然计算机软件智能生成的文字内容体现了对相关数据的选择、判断、分析,具有一定的独创性,但自然人创作完成仍应是著作权法上作品的必要条件。最终,法院判决百度公司侵害了原告的署名权、保护作品完整权和信息网络传播权,并赔偿相应经济损失。

(3)腾讯公司诉上海盈讯科技有限公司侵害著作权案

腾讯公司自主开发了一套基于数据和算法的智能写作辅助系统,涉案作品是由该系统下的Dreamwriter智能写作助手创作完成的一篇财经报道文章。上海盈讯科技有限公司未经允许即通过其经营的“网贷之家”网站向公众传播该文章。腾讯公司认为盈讯公司侵犯了其著作权,遂将其诉至法院。深圳南山区人民法院认为,涉案文章由原告主创团队人员运用Dreamwriter软件生成,其外在表现符合文字作品的形式要求,具有一定的独创性。法院认定涉案文章属于我国著作权法所保护的文字作品,并判决盈讯公司停止侵权、消除影响并赔偿损失。

(4)Huckabee v. Bloomberg案

被告在2024年3月22日提起驳回动议,辩称其行为构成开放式合理使用,特别是作为财经新闻和分析服务提供商在非商业研究项目中使用著作权作品训练生成式AI模型更属于合理使用的典型情形。案件尚在审理中。即使在非商业性研究项目中,合理使用抗辩的成功与否仍需法院根据具体情况进行判断。

(5)针对OpenAI的部分裁决

娱乐界名人、美国编剧工会及《纽约时报》指控ChatGPT内容侵权,美国加利福尼亚州联邦法院对OpenAI(ChatGPT运营方)作出部分裁决,驳回了多数指控,认为原告未能证明实质性相似,故无法认定侵权。同时,法院也驳回了原告关于追责不力将压制艺术家和破坏版权激励机制,以及OpenAI获得不当利益的主张。但需注意,这非最终裁决,原告关于大规模侵权和OpenAI合理使用抗辩等主张尚待裁决。因此,OpenAI仍面临严峻法律挑战。

3. 文生图侵权纠纷案件

(1)我国首例“文生图”侵权纠纷案

2023年2月,原告李某使用开源软件Stable Diffusion,通过输入正向和反向提示词、设置参数等方式生成了一幅人物图像,并将该图以“春风送来了温柔”为名发布在小红书。被告刘某未经许可使用该图像,原告李某认为被告的行为侵犯了其著作权,遂提起诉讼。北京互联网法院认为,原告利用人工智能技术生成的图片,若符合作品的定义,则应被认定为作品,受到著作权法保护。由于涉案图片体现了原告的智力投入和个性化表达,因此被认定为美术作品。法院判决被告刘某停止侵权行为,并赔偿原告经济损失。

(2)美国“文生图”生成物著作权侵权集体诉讼

美国三名艺术家Sarah Andersen、Kelly McKernan、Karla Ortiz针对Stability AI公司发起了全球首个关于“文生图”生成物著作权侵权的集体诉讼。该诉讼涉及Stability AI公司未经许可使用艺术家的作品来训练其生成式人工智能模型,并生成了与艺术家作品相似的图片。截至2024年2月24日,该案件仍在审理中,尚未形成有效判决。

(3)英国Getty Images v. Stability AI

在英国高等法院案件中,Getty Images起诉Stability AI,指控其开发的人工智能图像生成工具Stable Diffusion未经授权访问并复制了Getty受版权保护的图像,构成版权侵权。Stability AI则辩称其使用属于“合理使用”或基于公开数据训练的合法行为。此案成为人工智能时代版权法律辩论的焦点,结果可能对人工智能公司获取数据的方式及版权法如何适用于AI生成内容产生重大影响。

4. 音乐/声音相关诉讼

(1)北京互联网法院AI生成声音人格权侵权案

2024年4月23日,北京互联网法院判决配音师胜诉,AI开发者使用配音师声音、开发涉案AI文本转语音产品未获得合法授权,构成侵权。法院认定AI开发者的行为侵犯了配音师的人格权,需要承担相应的法律责任。

分析:此案例进一步强调了在AI训练过程中,即使是声音数据的使用,也需要获得权利人的明确授权,否则可能构成侵权。

(2)美国环球音乐等公司侵权案

美国环球音乐等音乐公司提起了对AI音乐生成平台Suno和Udio(Uncharted Labs)的诉讼,指控其未经授权使用音乐作品进行训练。

(3)Main Sequence, Ltd. v. Dudesy, LLC

原告起诉被告在未经其授权的情况下擅自使用AI以已故喜剧演员George Carlin的风格和声音创作喜剧节目I'm Glad I'm Dead。2024年6月,被告在该案中已被发布永久禁令,禁止发布相关内容。

(4)Lehrman v. Lovo, Inc.

2024年5月16日,配音演员Paul Skye Lehrman及Linnea Sage对AI公司LOVO提起诉讼,称其AI文字转声音功能未经授权使用了其声音。

上述部分案例反映了生成式AI在著作权领域面临的具体挑战,也揭示了现有法律框架在应对这些新型问题时的局限性。如何在保护创作者和AI公司技术发展中寻求平衡,是亟须解决的问题。

三、AI生成内容涉及侵权的法律责任

AI生成内容的侵权法律责任较为复杂,涉及多个层面和主体。以下是对其法律责任的详细分析:

(一)直接侵权责任

1. 数据训练阶段:未经授权使用数据构成侵权(如奥特曼案),合理使用抗辩受限。

如果AI服务提供者在训练模型时使用了未经授权的数据,导致生成的内容侵犯了他人的著作权,服务提供者应承担直接侵权责任。例如,在广州互联网法院审理的“奥特曼案”中,法院依据《生成式人工智能服务管理暂行办法》的有关规定,认定涉案平台作为AI服务提供者对于侵权行为未尽合理注意义务,从而承担侵权责任。

尽管存在合理使用的抗辩,但《中华人民共和国著作权法》的现行规定使得未经授权的数据使用较难被认定为合理使用。多数学者建议通过修订相关法规或引入数据挖掘专门例外来解决这一问题。

2. 内容生成阶段:采用“接触+实质性相似”标准判断侵权,服务提供者需承担连带责任。

如果AI生成的内容直接侵犯了他人的著作权,如生成与他人作品相似的图片、文字等,服务提供者也应承担直接侵权责任。例如,在“奥特曼案”中,某AIGC网站因生成了与“奥特曼”形象相似的图片,被判侵犯了原告的复制权和改编权,最终被责令停止侵权行为,并赔偿原告经济损失。

在判断是否构成侵权时,通常采用“接触+实质性相似”的标准。如果生成内容与原作品在表达上构成“实质性相似”且存在“接触”,则可能被认定为侵权。

AI服务提供者在训练模型时使用未经授权的数据,或生成内容与他人作品实质性相似,均构成直接侵权。合理使用抗辩在数据训练阶段受限,内容生成阶段需采用“接触+实质性相似”标准判断侵权。

(二)间接侵权责任

1. 用户行为:平台未尽审查义务需承担补充责任。

如果用户利用AI服务生成的内容侵犯了他人的著作权,AI服务提供者在现有技术条件下未尽到内容审查义务,应承担相应的补充责任。例如,当用户将侵权的生成内容扩散后,若服务提供者在收到被侵权人或者其他权利人的移除通知仍不履行义务,放任侵权行为继续发生,应视为构成共同侵权,和直接侵权人承担连带侵权责任。

如果用户仅是个人学习、研究或欣赏,而不进行传播,可能构成合理使用中的“个人使用”。然而,由于生成内容的最终来源往往是服务提供者的训练行为,传统的直接侵权和间接侵权分析框架难以适用,因此服务提供者仍可能因未尽注意义务而承担责任。

2. 技术限制:服务提供者可通过追偿权减轻责任,但需采取合理防侵权措施。

如果因技术限制未尽到审查义务,服务提供者应承担相应的补充责任,但应赋予服务提供者一定的追偿权,服务提供者承担责任后可向直接侵权人追偿。然而,技术中立原则的适用需谨慎,因为服务提供者在设计和运营过程中应采取合理措施防止侵权。

若用户利用AI服务生成的内容侵权,平台未尽审查义务需承担补充责任。因技术限制未尽审查义务的服务提供者,可通过追偿权减轻责任,但仍需采取合理防侵权措施。

(三)行政和刑事责任

违反《生成式人工智能服务管理暂行办法》等法规可能面临行政处罚;情节严重者(如故意侵权获利巨大)可追究刑事责任。

(四)法律责任的综合应对

AI生成内容侵权的法律责任较为复杂,涉及直接侵权、间接侵权、行政责任和刑事责任等多个层面。AI服务提供者和用户都应增强法律意识,遵守相关规定,避免侵权行为的发生。具体措施包括:

● 加强技术措施:如数据过滤、内容比对、数字水印等,以降低侵权风险。
● 完善合同条款:在服务协议中明确著作权归属和使用规则,规范用户行为。
● 强化审查义务:建立健全的内容审核机制,及时响应侵权投诉。
● 推动立法完善:通过修订《著作权法》或制定专门法规,明确AI生成内容的法律地位和责任边界。

通过以上措施,可以在保护著作权人合法权益的同时,促进生成式人工智能技术的健康发展。

四、平台如何判断人工智能生成的内容是否侵权?

在AI生成作品后,AI公司如何判断生成物是否构成侵权是必须解决的问题。AI公司需要采取一系列措施来判断生成内容是否构成侵权。首先,要判断内容是否具有独创性,内容需有整体性并体现用户的智力投入;其次,避免使用受著作权保护的数据,确保数据来源合法,避免使用与知名作品过于相似的元素;再次,检查内容是否与他人作品实质性相似,可借助查重工具等进行判断;最后,遵守平台和服务提供者的提示与规定,遵循AI服务提供者的提示,确保生成内容有显著标识。通过这些措施,平台可以在一定程度上降低侵权风险。以湖南省长沙市开福区人民法院最近审理的一起全国首例利用人工智能提供盗版影视作品链接的案件为例,法院审理后向涉事公司发出了全国首份涉“AI”知识产权司法建议书。

基本案情是:某信息技术公司起诉某科技公司侵害其信息网络传播权,因后者的人工智能产品在用户输入想看某影视剧后,会优先展示指向盗版资源网站的链接。

长沙市开福区人民法院马栏山法庭通过多方征询专家学者意见,并与各方沟通协调,最终推动各方达成共识,案件以撤诉结案。但法院并未止步,而是针对此案向某科技公司发出了司法建议书,强调需加强对人工智能产品所生成内容中可能存在的著作权等知识产权侵权风险的审查与管理,并要求建立健全有效的投诉与举报机制。某科技公司收到建议书后迅速复函整改。

此案不仅维护了原告的合法权益,更在业界树立了司法权威。随着生成式人工智能技术的飞速发展,人民法院的这一举措提醒整个AI行业,在追求技术创新的同时,不能忽视法律和道德的底线。那么,AI公司需采取以下措施判断生成内容是否侵权:

1. 判断内容是否具有独创性,需有整体性并体现用户智力投入。
内容需要有整体性,例如一个完整的视频或文章,而不是零散的片段。内容需要体现用户的智力投入,不能仅仅是简单复制或拼凑。

2. 确保数据来源合法,避免使用受著作权保护的数据及与知名作品过于相似的元素。

3. 借助查重工具等检查内容是否与他人作品实质性相似。
可以通过比较内容与他人作品的相似度,判断是否存在侵权风险。如果是论文,查重的工具很多。此外,需要考虑生成内容是否会对原作品的市场销售产生替代效果。

4. 遵守平台和服务提供者的提示与规定,确保生成内容有显著标识。

五、AI服务提供者如何防止侵权发生?

生成式人工智能(AI)的快速发展为内容创作带来了巨大机遇,但也伴随着复杂的著作权挑战。AI服务提供者需在数据处理、内容生成和用户管理等多个阶段采取有效措施,以降低侵权风险并确保合规运营。以下从三个阶段详细探讨AI服务提供者如何防止侵权发生。

(一)数据处理阶段:合法使用AI训练数据,避免著作权侵权。

1. AI服务提供者在数据处理阶段需确保数据来源合法:

(1)合法爬取数据:确保被爬取的数据为完全开放且可自由取用的数据,遵守网站的反爬措施,不影响网站正常运营。
(2)使用开源数据集:遵守许可协议,选择高质量的开源数据集。
(3)数据交易:明确授权,确保从合法供应商处购买数据,并在合同中明确侵权责任分担。
(4)使用公共数据:在开放目的范围内合理使用,确保数据质量。
(5)合成数据:遵循“合理匿名化”原则,避免使用真实个人数据。
(6)利用自身积累的数据:确保数据来源合法且符合隐私保护要求。

2. 技术措施降低侵权风险

数据过滤与清洗:通过关键词过滤、内容比对等技术,识别并排除受版权保护的内容。

数字水印与内容溯源:在AI系统中嵌入数字水印和内容溯源技术,确保生成内容的来源可追溯。

区块链技术:利用区块链记录数据来源和使用情况,确保数据的合法性和透明性。

如果是初创企业,可利用开源查重工具替代。

3. 全球共享数据库的探索

由全球互联网企业和学术机构成立联盟,标注互联网公开数据的著作权归属,AI公司通过支付许可使用费获取数据。例如德国“欧洲数据中心”和中欧数字环境下著作权保护研讨会的成立,为全球数据共享提供了实践基础。

(二)AI服务提供者在内容生成阶段需加强监管和标识:

1. 建立便捷的侵权举报渠道,迅速处理侵权投诉。
2. 显著标识AI生成内容,向用户披露创作过程及数据来源。
3. 采用技术措施和审核机制,避免生成侵权内容。
4. 在用户协议中明确AI生成内容的著作权归属,对数据提供方进行合规管理。

(三)AI服务提供者在用户管理阶段需规范用户行为,降低侵权风险:

1. 在用户协议中明确AI生成内容的著作权归属,要求用户不得生成侵权内容,并明确侵权责任。
2. 对屡次侵权的用户,采取终止账户使用权限等措施,增强用户法律意识。
3. 利用技术手段监控用户生成内容,记录生成过程和数据来源,便于侵权纠纷中提供证据。

(四)建议

AI服务提供者需在数据处理、内容生成和用户管理三个阶段采取综合措施,降低侵权风险并确保合规运营。具体建议如下:

1. 数据处理阶段:确保数据来源合法,采用技术措施降低侵权风险,探索全球共享数据库。
2. 内容生成阶段:加强内容监管和标识,建立举报机制,明确著作权归属。
3. 用户管理阶段:规范用户行为,通过用户协议和技术措施降低侵权风险。

通过上述措施,AI服务提供者可以在保护著作权的同时,促进生成式AI技术的健康发展。未来,随着技术的进步和法律框架的完善,AI行业将迎来更加规范化和可持续的发展环境。

六、全球生成式人工智能的相关立法现状

生成式人工智能(Generative AI)的快速发展对著作权保护提出了新的挑战。全球范围内,许多国家和地区已经开始制定相关的法律法规和规范性文件,以应对生成式人工智能在著作权领域的合规问题。以下是一些主要的法律法规和规范性文件及其核心内容:

1. 世界知识产权组织(WIPO)《AI与知识产权政策草案》

核心内容:WIPO发布了一系列关于AI与知识产权的政策草案,旨在为全球提供统一的指导框架。强调AI生成内容的版权归属应基于人类贡献的程度。呼吁各国加强合作,制定统一的AI数据使用和版权保护标准。

2. 欧盟《人工智能法案》(AI Act)

核心内容:这是全球首个全面规范人工智能的法律框架,为生成式AI的著作权合规提供了明确指引。该法案旨在对人工智能技术进行分类监管,将生成式AI系统纳入高风险类别。要求生成式AI的开发者和使用者确保其系统不会侵犯他人的知识产权,包括著作权。强调透明度,要求生成式AI生成的内容必须明确标注为“AI生成”。对未经授权使用受版权保护的数据训练AI模型的行为进行限制。

3. 美国《版权办公室生成式AI政策指南》

核心内容:美国版权办公室发布了一系列关于生成式AI的指南,明确AI生成的内容在何种情况下可以受到版权保护。强调只有人类创作的内容才能获得版权保护,完全由AI生成的内容不受版权保护。要求AI开发者在使用受版权保护的数据训练模型时,必须获得权利人的授权。

4. 中国《生成式人工智能服务管理暂行办法》

核心内容:这是中国首部专门针对生成式AI的法规,为AI技术的合规发展提供了法律保障。该办法由中国国家互联网信息办公室发布,旨在规范生成式AI的开发和应用。要求生成式AI服务提供者确保其训练数据来源合法,不得侵犯他人著作权。强调生成内容不得含有侵犯他人知识产权的内容。要求对生成内容进行标识,明确其为AI生成。

5. 日本《知识产权战略纲要》

核心内容:日本政府在其知识产权战略中明确了对生成式AI的监管方向。强调AI生成内容的版权归属问题,倾向于保护人类创作者的权利。鼓励AI开发者与版权持有人合作,确保数据使用的合法性。

6. 英国《人工智能与知识产权政策报告》

核心内容:英国知识产权局发布报告,探讨AI生成内容的版权保护问题。提出AI生成内容在满足“人类创造性贡献”的条件下,可能获得版权保护。强调AI开发者需确保训练数据的合法性,避免侵犯他人版权。

7. 加拿大《人工智能与数据法案》(AIDA)

核心内容:该法案要求AI开发者在使用数据时遵守版权法,确保数据来源合法。强调AI生成内容的透明性和可追溯性。对侵犯版权的AI生成行为进行处罚。

8. 澳大利亚《版权法与人工智能审查报告》

核心内容:澳大利亚政府发布报告,审查现行版权法对AI生成内容的适用性。提出修改版权法,以明确AI生成内容的版权归属。强调AI开发者需获得数据使用授权,避免侵权。

各国对“人类创造性贡献”的认定标准

在生成式人工智能(AI)生成内容的版权保护问题上,各国对“人类创造性贡献”的认定标准存在显著差异。以下是中国、美国、欧盟和英国在这一问题上的主要立场和法律规定:

国家/地区 核心标准 法律依据 实践案例
中国 独创性、智力成果 《中华人民共和国著作权法》第二条 “春风送来了温柔”案、“伴心”案、“文生图”第一案
美国 人类控制、创造性贡献 美国版权局《版权与人工智能》报告 “太空歌剧院”案、“天堂入口”案
欧盟 自然人创作、独创性 欧盟版权法 捷克AI版权纠纷案
英国 人类创造性贡献、独创性 英国知识产权局《人工智能与知识产权政策报告》 尚无明确案例,但政策报告为未来立法提供指导

全球范围内,生成式AI的著作权合规框架正在逐步建立。这些法律法规和规范性文件的核心内容主要集中在以下几个方面:

● 版权归属:明确AI生成内容的版权归属,通常倾向于保护人类创作者的权利。
● 数据使用合法性:要求AI开发者确保训练数据的来源合法,避免侵犯他人版权。
● 透明度与标识:要求AI生成内容明确标注为“AI生成”,以区分人类创作和AI创作。
● 国际合作:呼吁各国加强合作,制定统一的AI版权保护标准。

这些法律法规的出台,为生成式AI的健康发展提供了法律保障,同时也平衡了技术创新与版权保护之间的关系。此外,虽然很多国家都要求数据来源合法,但确保训练数据来源合法可能需要企业投入大量资源进行数据筛选、验证和授权获取,尤其是当数据来源广泛且分散时,如何高效地完成这一任务是一个挑战,需要多方共同参与、协作。

七、生成式人工智能的著作权合规框架构建

生成式人工智能(Generative AI)技术的快速发展使其在内容创作领域的应用日益广泛,同时也引发了诸多复杂的著作权侵权风险。构建一个既具备可行性又能有效应对这些风险的著作权合规框架,对于企业和开发者而言至关重要。这不仅能够助力他们规避法律风险,更能进一步激发技术创新与发展的活力。生成式人工智能的著作权合规框架需从法律修订、数据合法性、内容监管、国际合作及用户管理等多维度协同推进。以下为具体实施路径的段落式阐述:

(一)明确权利归属与法律规范

现行著作权法需修订以应对AI生成内容的特殊性,核心是界定其可版权性及归属规则。法律应明确“人类创造性贡献”为AI生成内容受保护的前提。例如,当用户通过设计详细提示词或对生成内容进行二次编辑时,其独创性投入可满足著作权保护标准,此时著作权归属用户;反之,若内容完全依赖AI预设算法生成,则开发者或运营方可通过“法人作品”主张权利。用户需保存提示词、参数设置及修改记录,作为主张权利的证据。

(二)优化数据使用合法性

训练数据的合法获取是合规框架的基础。开发者需优先使用开源数据、公共数据或合成数据,并与版权方建立授权合作,明确数据使用范围及付费模式。技术层面,需引入数据过滤工具排除受版权保护内容,并利用区块链技术记录数据来源、授权状态及使用路径,确保透明可追溯。

(三)强化内容监管与标识

为区分AI生成内容与人类创作,需强制嵌入显著标识,如不可删除的水印或元数据。同时,平台需建立侵权筛查机制,利用相似度检测工具比对生成内容与现有作品,识别潜在侵权风险;设立24小时投诉通道,要求48小时内下架涉嫌侵权内容。

(四)推动行业标准与国际合作

行业需制定统一标准,例如量化“人类创造性贡献”或规范数据使用。国际层面,可推动采纳世界知识产权组织(WIPO)《AI与知识产权政策草案》中的“人类贡献优先”原则,并建立跨境纠纷的统一管辖规则。此外,鼓励建立“AI数据共享池”,标注版权状态并开放合规使用,减少重复侵权风险。

(五)技术与用户管理并重

技术层面,需开发数字水印和区块链存证系统,将版权信息嵌入生成内容,并完整记录创作流程以供维权。用户管理方面,需通过协议明确权责,例如,用户享有编辑后内容的版权,但不得生成模仿知名IP的侵权内容;同时提供合规培训,指导用户设计合法提示词并定期推送风险提示。

八、展望与建议

随着生成式人工智能技术的持续进步,其在著作权领域所面临的挑战也将不断演变。针对这一趋势,以下是对未来几个关键发展方向的展望与建议:

(一)技术融合与创新带来的挑战与应对

未来,生成式人工智能将与虚拟现实(VR)、增强现实(AR)等先进技术深度融合,创造出更为丰富多样的内容形式。这种技术融合将进一步模糊传统著作权法的边界,对现有法律框架构成新的挑战。特别是当AI生成的虚拟现实场景或增强现实内容涉及多个权利主体(如AI开发者、数据提供者、内容创作者等)时,如何界定各主体的权利和责任将成为亟待解决的问题。

法律界与技术界应加强合作,共同探索适应新技术融合趋势的著作权保护机制。例如,可以通过制定专门的法规或行业标准来明确各权利主体的权利和义务,以及侵权责任的划分。同时,鼓励技术创新,开发更为智能和高效的著作权保护技术,以应对新技术融合带来的挑战。

(二)数据使用与隐私保护的平衡

随着数据保护和隐私法规的日益严格,生成式人工智能在训练数据的使用上将面临更为严格的监管。如何在保护用户隐私的同时,确保AI模型的训练质量和效率,成为亟待解决的问题。特别是当AI训练中涉及大量包含个人隐私信息的数据时,如何通过技术手段保护用户隐私,同时满足AI训练的需求,成为未来需要重点关注的方向。

加强数据保护和隐私法规的执行力度,确保AI训练数据的合法性和合规性。同时,鼓励技术创新,开发更为先进的数据匿名化、差分隐私等隐私保护技术,以降低用户隐私泄露的风险。此外,建议AI开发者在使用训练数据时,应充分尊重用户的隐私权,并遵守相关法律法规和行业标准。

(三)法律框架的适应与创新

面对生成式人工智能带来的挑战,法律框架必须进行适应与创新。这包括修改现有法律条文、制定新的法规以及建立专门的监管机制等。例如,针对AI生成内容的可版权性、权利归属、侵权认定等问题,现有法律框架可能需要进行相应的修订和完善。

政策制定者和法律从业者应密切关注生成式人工智能技术的发展动态,及时调整和完善相关法律和政策。同时,鼓励跨学科研究,促进法律、技术、伦理等领域的对话与合作,以更好地应对生成式人工智能带来的著作权问题。此外,建议加强国际合作与交流,共同推动生成式人工智能在著作权领域的合规发展。

综上所述,未来生成式人工智能在著作权领域将面临诸多挑战与机遇。通过加强技术创新、完善法律框架、强化数据保护与隐私保护等措施,我们可以更好地应对这些挑战,并推动生成式人工智能技术的健康发展。

九、结论

生成式人工智能的快速发展为内容创作带来了前所未有的机遇,同时也引发了诸多复杂的著作权问题。AI训练数据的合法性、生成内容的可版权性、侵权认定以及权利归属等问题,不仅考验着现行法律框架的适应性,也迫切需要我们寻求创新的解决方案。本文提出了构建生成式AI著作权合规框架的建议,包括完善法律法规、建立行业标准和自律机制、加强技术措施以及加强国际合作和协调等。作为法律从业者,我们需要持续关注技术发展动态,及时调整和完善相关法律和政策,以更好地适应这一新兴领域带来的挑战。同时,鼓励跨学科研究,促进法律、技术、伦理等领域的对话与合作,将为我们更好地应对生成式AI带来的著作权问题提供有力支持。在未来的发展中,我们期待看到一个既充满创新活力又兼顾法律秩序的内容创作生态。

参考文献

  • 诉讼频发!AI训练“盗用”著作权内容,建立共享数据库迫在眉睫?
  • 人工智能带来著作权之争 有待法律政策给指引_智慧普法平台
  • 李梦菲|生成式人工智能创作物在著作权领域的权利归属及保护路径_澎湃号·政务_澎湃新闻-The Paper
  • 人工智能生成内容属性判断关键在于独创性_中华人民共和国最高人民检察院
  • 人工智能内容生成的著作权之争:全球趋势与中国路径探索_法律_技术_OpenAI
  • 人工智能对知识产权法律保护的挑战及对策
  • 观韬知产观察 | 生成式人工智能生成物的法律属性与知识产权保护探析-北京观韬律师事务所
  • 张平:人工智能生成内容著作权合法性的制度难题及其解决路径

作者简介

姜向阳
海润天睿律师事务所 合伙人
jiangxiangyang@myhrtr.com


姜向阳律师从事知识产权业务近20年,擅长与商标、著作权、不正当竞争、商业秘密、特许经营等有关的知识产权法律业务。在企业知识产权国内外布局、商标授权确权、知识产权合规等方面有着丰富的实践经验。同时擅长处理各种涉及知识产权的纠纷,通过行政、民事、甚至刑事途径,解决各种侵权、假冒、仿冒纠纷,积极维护企业的知识产权。著有《商标法律实务精解与百案评析》,同时发表了多篇论文。