【人工智能】生成式人工智能著作权侵权问题刍议
马强 吴磊 竞天公诚律师事务所

关于生成式人工智能相关的知识产权法律讨论,核心通常聚焦于两个维度:一是人工智能生成内容本身的可版权性,二是生成式人工智能引发的著作权侵权问题。本文将围绕后者展开,具体结合“合理使用”规则以及“避风港”规则对于侵权认定问题进行初步梳理与探讨。

如果希望全然回避侵权认定与否问题的讨论,沿用传统的授权范式,从现实层面考量,一律要求事先通过许可获权,对于生成式人工智能而言,显然存在突出的现实困境。生成式人工智能的运行,离不开数据输入与模型训练两大核心环节,而这两个环节往往需要海量数据资源,自然会涉及大量受著作权保护的作品,1)逐一寻求所有著作权人的许可,无论是沟通时间成本,抑或是许可费用的交易成本,皆过高;2)通过外部途径核实著作权权属亦存在现实难度;3)作品对于AIGC平台的贡献价值缺乏公认的计算方式从而导致许可对价难以确定。纵然传统许可模式的可操作性难度极高,但若因为现实难度而一律倾向于支持生成式人工智能产业的发展,相对弱化对于著作权的保护,自有“倒果为因”的逻辑缺陷,有悖《著作权法》的立法初衷。本文将结合域外法与中国法的立法与司法层面对于生成式人工智能所涉著作权侵权问题进行初步探讨。

一、 数据输入与模型训练阶段 ——“合理使用”规则的适用要件

AIGC平台的运行一般分为:1)数据输入、2)模型训练、3)结果内容输出3个阶段。本文首先,就前2个阶段(1)数据输入与(2)模型训练,针对美国法项下的“合理使用”规则的讨论基础上,对于该规则在中国法项下的可适用性进行初步研究。

(一) 美国“合理使用”侵权抗辩规则以及司法实践

1、美国法项下的“合理使用规则”


1) 合理使用“4要素”(four factors for Fair Use)

美国《版权法》(Copyright Law of the United States)第107条[1]“专有权限制:合理使用”规定如下“4要素”个案裁量认定是否适用“合理使用”:

(1)要素1:使用的目的与性质,包括,为商业性,或是,为非营利教育之用:

(2)要素2:版权作品的性质

(3)要素3:被使用部分的数量与内容在整体版权作品中所占比重

(4)要素4:使用对于版权作品的潜在市场以及价值所产生的影响

2) 转换性使用 (Transformative Use)

“转换性使用”概念由美国Pierre Leval法官于1990年在其发表在《哈佛法律评论》(Harvard Law Review)的《论合理使用标准》(Toward a Fair Use Standard)[2]论文中首次提起,Pierre Leval法官将之界定为“原作品作为素材被引用,向原作品中加入了新的信息、新的审美、新的观察与理解,使得原作品添附新的价值,则属于合理使用理论为了社会利益而需保护的典型行为类型”(“the secondary use adds value to the original—if the quoted matter is used as raw material, transformed in the creation of new information, new aesthetics, new insights and understandings—this is the very type of activity that the fair use doctrine intends to protect for the enrichment of society”)。

1994年,美国联邦最高法院则在“Campbell案”[3]中,对于滑稽模仿(parody)是否构成合理使用问题的裁判过程中,首次适用了“转换性使用”的判定标准。此后,美国各法院逐渐将“转换性使用”作为考量是否构成合理使用的主要因素。

使用作品的“转换性”越强,对于原作品的“实质替代性”越弱,对于原作品的潜在市场与价值的影响就越小,从而,并不会实质损害原作品作者的权利,相反,对于有助于“鼓励创作”与“文化发展与繁荣”等公共利益的实现。

2、美国版权局《版权与人工智能》报告《第 3 部分:生成式人工智能训练》(预发布版本)

美国版权局(U.S. Copyright Office)于2025年5月发布《版权与人工智能》报告《第 3 部分:生成式人工智能训练》(预发布版本)(Copyright and Artificial Intelligence Part 3: Generative AI Training, pre-publication version)[4]第4部分“合理使用”(Fair Use)做出指引:“合理使用”抗辩是否成立,需由法院根据个案的事实与情状对于“合理使用4要素”与“著作权保护”进行权衡,并无机械或简便的计算公式,其亦注意到:对于第1、4项要素的评判将在整体认定中权重最高。[5]

3、美国人工智能著作权侵权相关司法判例之个案认定


1) Bartz诉Anthropic版权案

2025年6月23日,美国加利福尼亚州北部地区地方法院(United States District Court - Northern District Of California)针对Andrea Bartz, Charles Graeber, and Kirk Wallace Johnson(原告,3名作家)诉Anthropic PBC(被告)就“合理使用”问题的判决(ORDER ON FAIR USE)[6]针对“4要素”做出如下认定:
 

要素1:使用的目的与性质
 
A. 复制作品用于训练特定大型语言模型(Large Language Models, LLM)之行为:模型训练以生成新的文本构成典型的“转换性使用”,因在此情况下,Anthropic基于作品进行训练并非旨在复制或替代原作品,而是意在创作不同的作品[7] —— 属于“合理使用”

B. 复制作品用于建造中央图书馆之行为:

a) 如将合法购买的印刷版转化为数字版以节省空间并有助于搜索,便足以构成“转换性使用”[8] —— 属于“合理使用”

b) 如来源本为盗版,因其根源上便为“不可救药的”侵权,即便其可用于转换性用途,仍不可免责[9] —— 不构成“合理使用”
 
要素2:版权作品的性质
 
首先,法院认为,鉴于Anthropic认可,所有作者的书籍均包含表达的元素,因此,从第2要素评判,“合理使用”抗辩不成立[10]。

其次,法院确认,第2要素主要作用是用于帮助评估其他要素(第1、3要素)是否成立。[11]
 
要素3:被使用部分的数量与内容在整体版权作品中所占比重
 
A. 复制作品用于训练模型之行为:因为最终面向用户的Claude服务输出的内容与作者之作品之间并不存在可追溯的联系 —— 属于“合理使用”[12]

B. 复制作品用于建造中央图书馆之行为:

a) 如将合法购买的印刷版转化为数字版:未产生额外的副本,原始副本已经销毁 —— 属于“合理使用”[13]

b) 如来源本为盗版,Anthropic根本上无权复制副本 —— 不构成“合理使用”[14]
 
要素4:使用对于版权作品的潜在市场以及价值所产生的影响
 
A. 复制作品用于训练模型之行为:并不致取代对于作者原作品的需求(作者承认,模型训练并未导致任何原样复制,亦未向公众提供侵权抄袭之作)。即便作者抱怨,人工智能生成内容会与作者原作品构成竞争,但《版权法》旨在激励原创,而非保护作者免受竞争之忧—— 属于“合理使用”[15]

B. 复制作品用于建造中央图书馆之行为:

a) 如将合法购买的印刷版转化为数字版:格式的转化并未侵犯作者的合法权利[16]。

b) 如来源本为盗版,显然取代对于作者原作品的需求,显然减损了作者原作品的传统市场价值 —— 不构成“合理使用”[17]
 


结合“4元素”的权衡分析,法院认为:

(1)复制作品用于训练模型之行为 —— 应被认定为“合理使用”

(2)复制作品用于建造中央图书馆之行为:

—— 合法购买的印刷品的数字化转换 —— 应被认定为“合理使用”

—— 盗版来源的副本用于构建中央图书馆 —— 不构成“合理使用”

综上而言,我们初步总结法院的上述的个案衡量,

(1)首先,“数据输入、模型训练”行为属于典型“转换性使用”且不会损及原作品的市场价值,不会导致对于原作品的“替代性损害”,因此,构成“合理使用”;

(2)但是,“合理使用”抗辩成立的前提在于用于模型训练的数据来源应为合法取得,若数据本身为非法来源,即便后续“训练”具有多强的“转换性”,亦无法免除其根源上侵权之本质。

2) Kadrey诉Meta版权案

2025年6月25日,美国加利福尼亚州北部地区地方法院(United States District Court - Northern District Of California)针对Richard Kadrey, et al.,(原告,13名作家)诉META Platforms, INC.,(被告)做出判决[18]针对“4要素”做出如下认定:
 

要素1:使用的目的与性质
 
Meta的模型训练具有“高度的转换性”,因其具有“进一步的目的”和“不同的性质”,Meta原告作品的复制旨在模型训练,用以生成多样的文本并执行广泛的功能。用户可用之编辑邮件、翻译文本、撰写小品以及其他多种用途。相比之下,原告之作品的用途则在于娱乐或教育。[19]
 
要素2:版权作品的性质
 
法院首先认为,该第2项因素有利于原告,因为原告作品均具有极高的“表达性”,但是,法院认为,因原告作品已经公开发表,二次使用并不会干涉原告的发表权,因此,该第2项因素对于“合理使用”整体权衡判断的权重较低。[20]
 
要素3:被使用部分的数量与内容在整体版权作品中所占比重
 
即使Meta全文复制了原告的作品,但鉴于其“转换性”之目的,复制的数量是合理且必要的,因完整复制有利于提升其性能。[21]
 
要素4:使用对于版权作品的潜在市场以及价值所产生的影响
 
1、无法实质替代:即便采用促使模型进行机械重复的提示词,模型亦无法复现原作中超过50字之内容,因此,不会对原告作品的潜在市场与价值产生实质影响。[22]

2、作者无权垄断“模型训练的许可市场”[23]

3、原告并未提供实质证据以支持其“市场稀释”(market dilution)主张
 


虽然,法院本案支持“合理使用”抗辩,但法院亦明确表明,其做出本案判决,仅由于原告“举证不力”(法院明确指引,版权人可着重关注“市场稀释”问题的举证),亦明确表态,本判决并不意味着其认定Meta使用版权作品用于训练语言模型一律合法;且本案并非集体诉讼,仅涉及原告13名作者,并不影响Meta模型训练所使用作品的其他作者。[24]

但是,法院同时驳斥认为:Meta主张阻止其无需支付费用便可使用版权作品作为训练数据将会扼杀生成式人工智能技术的发展,从而危害“公共利益”属于无稽之谈。若模型训练无法被认定为合理使用,则意味着其应取得所需的许可,而非如Meta所述,全然阻止该产业的发展。[25]

(二) 中国“合理使用”侵权抗辩规则以及司法实践

1、中国法项下的“合理使用规则”


1) “3步检测法”基础上结合“4要素”判断

“合理使用”制度的设置目的即为著作权与社会公共利益之间的平衡。“合理使用规则”之“3步检测法”:

(1) 第1步:局限于特殊情形:在促进技术创新和商业发展确有必要的特殊情形下

(2) 第2步:不得影响作品的正常使用

(3) 第3步:不得不合理地损害著作权人的合法权益

2020年修订的《著作权法》第24条第1款第(13)项改变旧法的12种特殊情形之封闭式列举模式,增加“其他情形”弹性条款。一方面,适当缓解了立法面对现代技术现实需求所存在的“僵化”的问题,另一方面,将“合理使用”权利限制问题留给司法机关在一定原则与规则的约束下进行裁量[26]。

最高人民法院印发《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》的通知:第8条一定程度上亦引入了美国的“合理使用4要素”判断方法:(1)作品使用行为的性质和目的、(2)被使用作品的性质、(3)被使用部分的数量和质量、(4)使用对作品潜在市场或价值的影响等因素。
 

《著作权法(2020修正)》(施行日期:2021.06.01)第24条:在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称,并且不得影响该作品的正常使用,也不得不合理地损害著作权人的合法权益:……(13)法律、行政法规规定的其他情形
 
《著作权法实施条例(2013修订)》(施行日期:2013.03.01)第21条依照著作权法有关规定,使用可以不经著作权人许可的已经发表的作品的,不得影响该作品的正常使用,也不得不合理地损害著作权人的合法利益
 
《保护文学和艺术作品伯尔尼公约》(BerneConventionfortheProtectionof

LiteraryandArtisticWorks(我国于1992年10月15日加入巴黎文本)

第9条第(2)款:“三步检测法”:(1)只能作为特殊情况而存在;(2)不与作

品的正常使用相抵触;(3)不得无理损害著作权人的合法利益。
 
《与贸易有关的知识产权协议》(AgreementonTrade-RelatedAspectsof

IntellectualPropertyRights(我国于2001年12月11日加入)

第13条:限制与例外:各成员应将各种专有权的限制或例外局限于某些特殊情

形,而这些情形是与作品的正常利用不相冲突,并且不会不合理地损害权利持

有人的合法利益的。
 
最高人民法院印发《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》的通知(施行日期:2011.12.16):8、妥当运用著作权的限制和例外规定,正确判定被诉侵权行为的合法性,促进商业和技术创新,充分保障人民基本文化权益。正确认定合理使用和法定许可行为,依法保护作品的正当利用和传播。在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用。
 


2) 转换性使用

“转换性使用”在我国司法实践中亦有适用与分析:
 

法院:上海知识产权法院

案号:(2015)沪知民终字第730号

原告:上海美术电影制片厂

被告:某文化传播有限公司、某上海影院管理有限公司

案由:著作权侵权纠纷

原告权利作品:“葫芦娃”、“黑猫警长”角色形象美术作品
 
其中,为说明某一问题,是指对作品的引用是为了说明其他问题,并不是为了纯粹展示被引用作品本身的艺术价值,而被引用作品在新作品中的被引用致使其原有的艺术价值和功能发生了转换;而该被引用作品在新作品中亦不是以必需为前提,即使在新作品中引用作品不是必需的,也会构成合理使用。

……“葫芦娃”、“黑猫警长”是八十年代家喻户晓的少儿动画形象,对于经历八十年代少年儿童期的人们可谓深入人心,因此,“葫芦娃”、“黑猫警长”动画形象自然亦是八十年代少年儿童的部分成长记忆。涉案电影海报中不仅仅引用了“葫芦娃”、“黑猫警长”美术作品,还引用了诸多八十年代少年儿童经历的具有代表性的人、景、物,如:黑白电视机、落地灯、缝纫机、二八式自行车、热水瓶、痰盂、课桌、铅笔盒、铁皮青蛙、陀螺、弹珠、无花果及着白绿校服的少先队员升旗仪式、课堂活动、课余游戏等时代元素,涵盖了八十年代少年儿童日用品、文教用品、玩具、零食以及生活学习场景等多个方面,整个电影海报内容呈现给受众的是关于八十年代少年儿童日常生活经历的信息。因此,电影海报中引用“葫芦娃”、“黑猫警长”美术作品不再是单纯的再现“葫芦娃”、“黑猫警长”美术作品的艺术美感和功能,而是反映一代共同经历八十年代少年儿童期,曾经经历“葫芦娃”、“黑猫警长”动画片盛播的时代年龄特征,亦符合电影主角的年龄特征。因此,“葫芦娃”、“黑猫警长”美术作品被引用在电影海报中具有了新的价值、意义和功能,其原有的艺术价值功能发生了转换,而且转换性程度较高,属于我国著作权法规定的为了说明某一问题的情形

……综上所述,涉案电影海报为说明八十年代少年儿童的年代特征这一特殊情况,适当引用当时具有代表性的少儿动画形象“葫芦娃”、“黑猫警长”之美术作品,与其他具有当年年代特征的元素一起作为电影海报背景图案,构成合理使用
 


2、中国人工智能著作权侵权相关司法判例之个案认定

关于生成式人工智能“合理使用”问题的讨论,并未体现在我国立法或执法指导性文件中。

《生成式人工智能服务管理暂行办法》(施行日期:2023.08.15)第3条规定:国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。—— 强调了促进人工智能产业发展之目的,实行“包容审慎”监管模式。

而在如下司法案例中,法院界定了生成式人工智能“合理使用”的认定要件:
 

一审法院 & 案号:杭州互联网法院【(2024)浙0192民初1587号】

二审法院 & 案号:浙江省杭州市中级人民法院【(2024)浙01民终10332号】

原告:上海新创华文化发展有限公司

被告:杭州水母智能科技有限公司

案由:著作权侵权及不正当竞争纠纷

原告权利作品:奥特曼形象之美术作品
 
1、对于数据输入、数据训练行为:侵权认定标准应相对宽松包容;生成内容输出与使用行为:应相对从严

本院认为,人工智能是基于算力、算法和数据等关键要素发展起来的、引领新一轮科技革命和产业变革的战略性技术,是发展新质生产力的主要阵地。在我国人工智能产业迅猛发展之际,应坚持发展和安全并重、促进创新和依法治理相结合的原则,对生成式人工智能服务实行包容审慎兼顾权利保障和服务产业健康高效发展,推动形成公平合理、开放包容的人工智能治理体系。生成式人工智能主要包括四个重要阶段:数据输入、数据训练、内容输出、内容使用,从促进生成式人工智能技术发展的角度来看,对于大模型的数据输入、数据训练行为的侵权认定,宜采取相对宽松包容的认定标准,对大模型的生成内容输出、生成内容使用行为的侵权认定,则宜采取相对从严的认定标准,通过分类施策实现发展与保护的平衡。

● 合理使用范围与边界的界定

1、合理使用 —— 对于生成式人工智能应持审慎包容的态度,鼓励技术进步和商业发展。生成式人工智能的创设与发展,需要在输入端引入巨量的训练数据,其中不可避免会使用他人作品。鉴于生成式人工智能在数据训练阶段使用他人作品的目的,原则上应是用于学习分析在先作品所表达的思想感情、语言特征、特色风格等内容,从中提取出相应的规则、结构、模式、趋势,便于后续转换性创作新作品。该种使用行为聚合大量作品作为分析样本数据进行提高作品创作能力训练,并非以再现作品的独创性表达为目的且一般情况下数据训练只是对语料数据作结构特征分析时暂时保留了在先作品,数据训练及生成过程中也未将在先作品展示给公众,因此,本院认为,在无证据证明生成式人工智能是为使用权利作品的独创性表达为目的、已影响到权利作品正常使用或者不合理地损害相关著作权人的合法利益等情形下,可以被认为是合理使用在用户仍可以学习、研究、欣赏自己存储在平台中的相关图片或者对该图片进行其他合理使用且并未对外传播,或者存在权利人或其授权人自行使用相关图片等情形下,对于上海某文化发展有限公司概括性地要求判令杭州某智能科技有限公司删除与奥特曼有关的全部物料和相关数据的诉请,超出了杭州某智能科技有限公司应负担的义务,本院对此不予支持

2、鼓励创作、繁荣文化之公共利益 —— LoRA模型训练服务和参考生图服务旨在为用户在生成扩散式模型的基础上提供更具有个性化的“内容定制”,以便更好地满足用户使用生成式人工智能进行创作的需求,提升用户使用生成式人工智能进行创作的效率……从该商业模式本身来看,其旨在扩展生成式人工智能的应用场景和功能,让生成式人工智能技术更好地服务于用户创作,极大方便了用户的作品创作活动,在给用户带来较多福祉的同时亦有利于文学、艺术创作的繁荣,有助于文化事业的发展,符合“效率优先”的自由竞争要求,并未违反诚信原则和商业道德。

3、技术中立 —— 基础模型和LoRA模型训练、参考生图的技术本身具有中立性,一方面,如果用户按照平台服务协议在尊重他人知识产权的前提下进行生成式人工智能创作,一般不会侵害著作权人的合法权益;

4、竞争乃常态、著作权人无权阻止自由公平竞争 —— 另一方面,在此种新型商业模式和经营方式下所生成的新作品,虽然可能对于在先作品的影响力会产生一定冲击,但新旧作品间此种影响力的此消彼长是竞争的常态化结果,并非是对在先作品著作权人合法权益的实质性损害,并不具备不合理损害其他主体竞争权益和消费者权益的特征,符合公平竞争要求
 


(三) 总结


综合中美两国的司法实践,对于生成式人工智能平台的数据输入/投喂、模型训练是否构成“合理使用”均需按照个案不同的案情与双方举证情况进行认定,在如下情况下,可认定为合理使用:

(1)第1要素:作品使用行为的性质和目的 —— 如果模型训练具有越高“转换性”,并非以再现、传播、利用原作品的独创性表达为目的,仅是将之作为训练素材用以执行不同的功能与用途(例如邮件编辑、文本翻译等等)、创作出不同独创性的作品,则能够实现“进一步的目的”和“不同的性质”,从而产生新的价值,则构成“转换性使用”

(2)第2要素:被使用作品的性质 —— 独创性高的原作品具有较高的“表达性”,从该第2要素判断,不构成合理使用,但该要素在“合理使用”整体权衡判断的权重较低。

(3)第3要素:被使用部分的数量和质量 —— 若为实现前述第1项要素“转换性”之目的,全文复制或者说使用的数量与程度是合理且必要的,则构成合理使用。

(4)第4要素:使用对作品潜在市场或价值的影响 —— 如果无法实质替代原作品,而且数据训练过程并未将原作品向公众展示,则不会对原作品的潜在市场以及价值产生实质影响,不与原作品的正常使用相冲突,亦不至于不合理地损害著作权人的合法权益

之所以支持“合理使用”抗辩的成立,往往是基于如下因素的考量:

1、产业发展 —— 基于人工智能产业发展以及著作权保护的利益平衡考量,对于生成式人工智能服务的侵权认定应既包容又审慎的标准

2、鼓励创作、繁荣文化之公共利益 —— AIGC平台有助于激励用户创作,提供便利条件,促进文化大发展大繁荣,符合社会公共利益

3、技术中立原则 —— 生成式人工智能技术本身具有中立性

4、竞争乃常态、著作权人无权阻止自由公平竞争

二、 结果内容输出阶段 —— 沿用网络服务提供者“避风港”规则

如前文,杭州互联网法院【(2024)浙0192民初1587号】民事判决书所述,对于大模型的数据输入、数据训练行为的侵权认定,宜采取相对宽松包容的认定标准,对大模型的生成内容输出、生成内容使用行为的侵权认定,则宜采取相对从严的认定标准,通过分类施策实现发展与保护的平衡。

但,网络服务提供者“避风港”规则可否直接沿用,适用的方式与条件如何,亦需进一步讨论,杭州互联网法院【(2024)浙0192民初1587号】民事判决书所述,生成式人工智能服务提供者提供的网络服务有别于传统的网络内容提供行为、网络存储空间服务提供行为和搜索链接服务提供行为等,生成式人工智能服务提供者兼具内容生产者与平台管理者的双重身份,属于一种新型的网络服务。

(一) 立法层面对于“生成式人工智能服务提供者”的监管

《生成式人工智能服务管理暂行办法》(施行日期:2023.08.15)

第4条:提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:……(3)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为……基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。

第7条:生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:

(一)使用具有合法来源的数据和基础模型;

(二)涉及知识产权的,不得侵害他人依法享有的知识产权;

第14条:提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。

提供者发现使用者利用生成式人工智能服务从事违法活动的,应当依法依约采取警示、限制功能、暂停或者终止向其提供服务等处置措施,保存有关记录,并向有关主管部门报告。

第15条:提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。

第12条:提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。

2024年3月1日,全国网络安全标准化技术委员会发布TC260-003《生成式人工智能服务安全基本要求》

5.2 语料内容安全要求

对服务提供者的要求如下。

(b)知识产权方面:

(1)应设置语料以及生成内容的知识产权负责人,并建立知识产权管理策略;

(2)语料用于训练前,应对语料中的主要知识产权侵权风险进行识别,发现存在知识产权侵权等问题的,服务提供者不应使用相关语料进行训练;例如,语料中包含文学、艺术、科学作品的,应重点识别语料以及生成内容中的著作权侵权问题;

(3)应建立知识产权问题的投诉举报渠道;

(4)应在用户服务协议中,向使用者告知使用生成内容时的知识产权相关风险,并与使用者约定关于知识产权问题识别的责任与义务;

(5)应及时根据国家政策以及第三方投诉情况更新知识产权相关策略;

(6)宜具备以下知识产权措施:

—— 公开语料中涉及知识产权部分的摘要信息;

—— 在投诉举报渠道中支持第三方就语料使用情况以及相关知识产权情况进行查询。

(二) 司法层面对于“生成式人工智能服务提供者”的“注意义务”的界定

在如下两例“奥特曼”案中,法院对于“生成式人工智能服务提供者”的“注意义务”的界定:
 

法院:广州互联网法院

案号:(2024)粤0192民初113号

原告:上海新创华文化发展有限公司

被告:广州年光网络科技有限公司

案由:著作权侵权纠纷

原告权利作品:奥特曼形象之美术作品

被诉行为:被告Chatstudio AI平台生成的奥特曼形象与原告奥特曼形象构成实质性相似
 
● 侵权定性

1、原告所提供的、由Tab网站生成的案涉图片,部分或完全复制了“奥特曼”这一美术形象的独创性表达。因此,被告未经许可,复制了案涉奥特曼作品,侵犯了原告对案涉奥特曼作品的复制权

2、案涉生成图片部分保留了“迪迦奥特曼复合型”作品的独创性表达,并在保留该独创性表达的基础上形成了新的特征。被告上述行为构成对案涉奥特曼作品的改编。因此,被告未经许可,改编了案涉奥特曼作品,侵犯了原告对案涉奥特曼作品的改编权

● 注意义务:被告作为生成式人工智能服务提供者,未尽到合理的注意义务,主观上存在过错

1、第一,投诉举报机制的欠缺:结合本案认定事实,特别是本院当庭查明情况,截至开庭之日,被告经营的Tab网站并未建立相关投诉举报机制,使得权利人难以通过投诉举报机制来保护其著作权。

2、第二,潜在风险提示的欠缺:本案中,被告作为服务提供者未以服务协议等方式提示用户不得侵害他人著作权。而与一般的网络服务存在显著区别的是,一般而言,用户在使用生成式人工智能服务时,对他人特别是著作权人的潜在侵权风险缺乏明确认知,因此生成式人工智能服务提供者有义务对用户进行提示,这其中就包括用户不能利用其服务侵犯他人著作权

3、第三,显著标识的欠缺:生成式人工智能服务提供者在生成物可能导致公众混淆或者误认的情况下,有义务对其提供的生成物进行显著标识。经标识后,有关权利人能够明确认识到生成物系由人工智能生成,进而采取更具针对性和有效的维权措施,更好地保护其权利。因此,标识义务不仅是对公众知情权的尊重,也是对权利人的一种保护性义务。就本案而言,被告并未显著标识案涉生成图片,未尽标识义务。

●责任承担

1、停止侵害:被告作为生成式人工智能服务提供者:1)应采取技术性措施来停止生成与案涉奥特曼作品实质性相似的图片;2)应进一步采取关键词过滤等措施,防范其服务继续生成与案涉奥特曼作品实质性相似的图片,防范程度应达到:用户正常使用与奥特曼相关的提示词,不能生成与案涉奥特曼作品实质性相似的图片

2、赔偿损失酌定 – 1万元(经济损失 及 含合理开支)

● 利益平衡的释明:人工智能产业发展 Vs. 著作权保护

本院需要强调的是,人工智能是引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,被认为是发展新质生产力的主要阵地。我国人工智能技术快速发展、数据和算力资源日益丰富、应用场景不断拓展,为开展人工智能场景创新奠定了坚实基础。考虑到生成式人工智能产业正处于发展的初期,需要同时兼顾权利保障和产业发展,不宜过度加重服务提供者的义务。在技术的飞速发展过程中,服务提供者应当主动积极履行合理的、可负担的注意义务,从而为促进形成安全与发展相济、平衡与包容相成、创新与保护相容的中国式人工智能治理体系提供助益。
 
一审法院 & 案号:杭州互联网法院【(2024)浙0192民初1587号】

二审法院 & 案号:浙江省杭州市中级人民法院【(2024)浙01民终10332号】

原告:上海新创华文化发展有限公司

被告:杭州水母智能科技有限公司

案由:著作权侵权及不正当竞争纠纷

原告权利作品:奥特曼形象之美术作品
 

●侵权定性

1、不构成直接侵权:

本案中,上海某文化发展有限公司主张的侵权图片中用于数据训练的奥特曼图片由用户上传主张侵权的LoRA模型的封面图或示例图亦由用户上传,尽管用户实施生成图片的行为利用了杭州某智能科技有限公司提供的生成式人工智能服务,涉案侵权图片亦通过用户在平台发布或分享实现了信息网络传播,但从客观方面来看,下达指令决定生成内容及其受众的是人工智能服务的使用者即用户被告作为运营者,并未参与到用户实施的上传参考图片、发布和分享生成图片的行为之中;从主观方面来看,亦缺乏证据证明被告在用户的涉案行为中,与用户之间存在共同提供作品的意思联络,因此,被告不是网络传播内容的提供者,未直接实施受信息网络传播权控制的行为,不构成直接侵权。

2、构成帮助侵权

应当注意到,生成式人工智能服务提供者提供的网络服务有别于传统的网络内容提供行为、网络存储空间服务提供行为和搜索链接服务提供行为等,生成式人工智能服务提供者兼具内容生产者与平台管理者的双重身份,属于一种新型的网络服务。一方面,如前所述,若生成式人工智能服务提供者直接实施了受著作权专有权控制的行为,可构成直接侵权。另一方面,如本案中,在由用户输入提示词、上传侵权图片等训练语料并决定是否生成及公开传播时,生成式人工智能服务提供者既没有提供侵权训练语料也不能对输出的内容以及输出的过程进行完全的控制和干预,此时,生成式人工智能服务提供者系提供生成式人工智能技术服务,对用户输入的提示词、训练图片等数据内容,以及生成物的传播等行为并不当然负有事先审查的义务,只有当其对具体侵权行为具有过错时,才可能构成帮助侵权。对于过错的认定规则,应综合考量生成式人工智能服务的性质、当前人工智能技术的发展水平、避免损害的替代设计的可行性与成本、可以采取的必要措施及其效果、侵权责任的承担对行业的影响等因素,通过动态地调整过错的认定标准,将平台注意义务控制在合理的程度。具体而言,即以同质行业理性人标准予以考量,当生成式人工智能服务提供者可以证明施以同业一般服务提供者注意力难以发现该生成内容可能构成侵权,或者能够证明自身已经采取了符合损害发生时技术水平的必要措施来预防损害,但仍无法防止损害的发生,应认定其已尽到合理的注意义务,不具有过错。反之,则应认定其具有过错。

1)被告AI平台提供生成式人工智能服务的性质

被告运营的某AI平台通过调用SD开源模型,结合平台需求和使用场景进行技术整合和应用部署,完成封装、传输、存储等一系列工程化操作,最终集合成可供用户直接应用的生成式人工智能平台……该类生成式人工智能服务提供者直接参与商业实践并基于定向生成的内容获益,从服务类型、商业逻辑和防范成本角度看,应当对具体应用场景下的内容保持足够的了解,承担相应的注意义务

2)权利作品的知名度和被诉侵权事实的明显程度

涉案奥特曼作品在全球范围内具有相当高的知名度和影响力……涉案侵权图片和侵权LoRA模型属于可以较为明显感知的侵权信息,故被告系将具有较高知名度的动漫作品的侵权内容置于其平台中能够为其较为明显感知的位置,被告应当知道相关内容具有较大侵权可能性

3)涉案生成式人工智能可能引发的侵权后果

根据保全证据显示,当用户仅输入奥特曼文本提示词并选择平台上的Checkpoint基础模型进行训练,无法直接生成奥特曼具体形象,但同时叠加奥特曼LoRA模型进行训练,则生成奥特曼图片。一般而言,生成式人工智能对于用户使用行为的结果并不具有可识别性、可干预性,生成的图片亦具有随机性,但本案中因为叠加奥特曼LoRA模型,可以稳定输出图片角色形象的特征,此时生成式人工智能对于用户使用行为的结果增强了可识别性、可干预性。同时因生成式人工智能的便捷性,用户生成上传的奥特曼LoRA模型可以被其他用户反复使用,如“布莱泽奥特曼”LoRA模型使用次数已达1000次,其他用户再叠加奥特曼LoRA模型后又会不断生成出更多的侵权内容,其引发侵害权利人信息网络传播权后果的态势已相当明显,侵权内容扩散风险较高,因此,杭州某智能科技有限公司应当就相关侵权内容的生成承担更高的注意义务,应当预见到在其提供生成式人工智能服务的过程中著作权侵权行为发生的可能性

4)某AI平台的营利模式

某AI平台付费会员拥有更丰富、更多的功能和权益,在作图和LoRA模型训练过程中设有会员快速通道;平台通过用户充值会员和积分获取收益,并通过会员特权、积分等奖励措施对用户进行引导,如在用户训练生成模型后鼓励用户发布并分享链接和邀请好友,即可享有触手PLUS优先特权;数据训练时提示开通会员,享会员通道及积分;积分可在创作过程中使用,作图免消耗积分等。综上,可以认为杭州某智能科技有限公司可从某AI平台提供的AI创作服务中直接获得经济利益

5)杭州某智能科技有限公司是否积极采取了预防侵权的合理措施

但杭州某智能科技有限公司在平台用户服务协议中声明不对用户上传和发布的内容进行审核,且诉讼前保全证据中未明确显示杭州某智能科技有限公司在网站相对明显的位置设置投诉举报渠道。杭州某智能科技有限公司在收到诉讼通知后已在网站中将奥特曼相关内容进行屏蔽、在后台进行知识产权审核,证明在网站首页检索、浏览以及图片发布、LoRA模型发布过程中可以通过未明显增加过重成本负担的技术措施控制、过滤相关侵权信息,说明杭州某智能科技有限公司有能力采取却怠于采取符合侵权损害发生时技术水平的必要措施来预防侵权

结论 —— 杭州某智能科技有限公司作为生成式人工智能服务提供者,应当知道网络用户利用其网络服务侵害涉案作品信息网络传播权而未采取必要措施,其未尽到合理注意义务,主观上存在过错,应当认定构成侵害上海某文化发展有限公司信息网络传播权的帮助侵权行为

● 责任承担

1、停止侵权:

1)删除涉案生成的奥特曼图片并停止提供与生成奥特曼图片的发布服务;

2)删除被诉侵权的奥特曼LoRA模型,并应停止提供相关奥特曼LoRA模型的发布和应用服务

3)采取必要措施有效制止侵权行为,在提供服务的过程中防止用户生成并发布侵害原告信息网络传播权的图片或LoRA模型

2)赔偿损失:酌定 – 3万元(经济损失 及 含合理开支)

● 用户输入“投喂”数据

1、对用户输入的提示词、训练图片等数据内容,以及生成物的传播等行为并不当然负有事先审查的义务

2、平台在服务用户过程中,由用户输入的数据。当服务提供者向公众提供由用户参与训练的模型服务时,有来自全球各地的海量用户对模型进行数据“投喂”,这些数据的合法性和版权状态可能各不相同。在此情况下,若严格要求服务提供者对用户输入端的每一份数据进行逐一审查和验证,既不具有可行性,也与其法律属性不相适应,无疑会加重开发监管负担,势必阻碍生成式人工智能的发展,因此服务提供者的注意义务应当与其身份及信息管理能力相适应。
 


(三) 总结


目前已经做出裁判的两例“奥特曼”案的侵权认定,均未涉及对于“数据输入、模型训练”行为的评判:(1)广互一案,案涉图片系由第三方服务商提供,被诉AIGC平台实际进行模型训练行为;(2)杭互、杭州中院一案,用于数据训练的案涉图片为用户上传。

结合《生成式人工智能服务管理暂行办法》以及上述2案判理,我们尝试总结如下:

1、不构成直接侵权 —— 用于模型训练的数据由用户上传、用户利用AIGC平台生成侵权内容,且生成的侵权内容由用户发布。AIGC平台客观上并未实施模型训练参考图的上传、侵权内容的发布行为,主观上,亦与用户不存在分工合作的意思联络。

2、不负有事先审查义务 —— 对于用户输入“投喂”训练数据、提示词、生成内容的传播,不当然负有事先审查义务:如此对于能力的过严要求不当加重平台负担,阻碍产业发展

3、未经合理注意义务,则具有主观过错,构成间接侵权(帮助侵权)

尽到合理注意义务包括:

1)施以同业一般服务提供者注意力难以发现该生成内容可能构成侵权:权利作品的知名度与影响力;生成内容是否具有可识别性

2)积极采取必要的合理措施预防侵权

● 健全投诉举报机制、设置便捷的投诉举报渠道、及时处理投诉举报

● 提示用户知识产权保护,不得侵犯他人著作权

● 屏蔽提示词、过滤侵权信息,防范生成侵权内容

若人工智能服务提供者从提供服务中直接获得经济利益的(例如,付费会员等),则负有更高的注意义务。

三、 结语

针对生成性人工智能服务提供者知识产权保护的规制,按照立法、司法以及法学理论层面讨论,需要权衡:1)著作权的保护;2)生成性人工智能产业发展;3)文化发展繁荣等社会公共利益等多方面的平衡,以及“技术中立”原则的考量,需要对于生成性人工智能服务提供者进行既包容又审慎的监管。

通过“合理使用”规则,根据个案不同AIGC平台的运作方式,考量其是否具有“高转换性”创造新的价值,是否实质影响作品的潜在市场与价值,是否不合理地损害著作权人的利益,允许法院根据“3步检测法”与“4要素”的原则性要件进行个案判断。

通过“避风港规则”,对于生成性人工智能服务提供者明晰其应尽的合理注意义务,但亦不宜对其施加过重的义务与负担,结合产业技术能力以及个案实践,评判其是否存在主观过错,对其侵权进行认定。

作者简介:


马强 合伙人
竞天公诚律师事务所
邮箱:ma.qiang@jingtian.com

北京办公室
电话:(86-10) 5675 3018
专业领域:知识产权、诉讼、竞争法/反垄断
马强律师毕业于中国人民大学,获得国际知识产权法学博士学位。在加入竞天公诚之前,马律师曾在几家领先的律师事务所担任合伙人。马律师有超过二十年的知识产权法律执业经验。连续九年被知名法律媒体钱伯斯(Chambers)亚太(大中华区)榜单高度推荐为“知识产权诉讼律师”,曾获《商法》杂志The A-List精英律师,多次获评《世界商标评论》金榜律师和全球领袖、ALB十五佳知识产权律师、《亚洲法律》领先律师、《管理知识产权》“知识产权之星”等。
马律师的主要执业领域为商标、著作权和反不正当竞争。马律师精通商标确权战略咨询、商标维权与实施、反假冒、知识产权边境保护,境外知识产权保护等,在以商标权、著作权、不正当竞争为主的知识产权诉讼和非诉方面具有丰富的经验,所服务的客户涉及互联网、汽车、通信、零售、科技、游戏、服装、奢侈品、不动产、食品饮料、药品及保健品、影视传媒、教育等多个领域。
马律师现为世界知识产权组织域名仲裁专家、上海交通大学凯原法学院兼职硕士生导师、对外经济贸易大学法学院兼职校外导师、北京理工大学法学院兼职硕士生导师、中华商标协会行政司法交流委员会副主任、广东商标协会行政确权与保护委员会执行主任、北京知识产权研究会服务贸易专业委员会执行主任。马律师曾在《中华商标》《知识产权》等专业杂志发表多篇专业文章,是《中国知识产权保护实务指南》(CCH出版)的主要作者之一,主译《商标法:实证性分析》(2014年中国人民大学出版社)。


吴磊 顾问
竞天公诚律师事务所
邮箱:wulei.bj@jingtian.com

北京办公室
专业领域:知识产权(商标、著作权)及不正当竞争
吴磊律师拥有 12 年知识产权诉讼及非诉经验,涉及商标、著作权、不正当竞争,服务互联网、娱乐、汽车、房地产等行业。本科毕业于中国人民大学法学院与外国语学院,取得法学学士学位与法语文学学士;硕士毕业于中国人民大学法学院,取得法学硕士学位;曾就读于法国巴黎第一大学法学院,取得硕士学位。亦持有中国律师执业证书。实务经验涉及商标及著作权侵权、不正当竞争纠纷之民事诉讼与民事维权、知识产权合同起草与审阅等法律业务。

********************
[1] https://www.copyright.gov/title17/92chap1.html
[2] Pierre N. Leval, Toward a Fair Use Standard, 103 HARV. L. REV. 1105, 1111
[3] Campbell v. Acuff-Rose Music, Inc., 510 U.S. 569, 579 (1994).
[4] https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf
[5] It is for the courts to weigh the statutory factors together “in light of the purposes of copyright,”415 with no mechanical computation or easy formula. How much each factor adds to the balance, and in which direction, will depend on the facts and circumstances of the particular case. We observe, however, that the first and fourth factors can be expected to assume considerable weight in the analysis.
[6] Bartz v. Anthropic PBC, 3:24-cv-05417:https://storage.courtlistener.com/recap/gov.uscourts.cand.434709/gov.uscourts.cand.434709.231.0_4.pdf
[7] 原文:THE COPIES USED TO TRAIN SPECIFIC LLMS - In short, the purpose and character of using copyrighted works to train LLMs to generate new text was quintessentially transformative. Like any reader aspiring to be a writer, Anthropic’s LLMs trained upon works not to race ahead and replicate or supplant them — but to turn a hard corner and create something different. If this training process reasonably required making copies within the LLM or otherwise, those copies were engaged in a transformative use.
[8] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (i) The Purchased Library Copies Converted from Print to Digital - However, this order holds that the mere conversion of a print book to a digital file to save space and enable searchability was transformative for that reason alone. Therefore, the digital copy should be treated just as if the purchased print copy had been placed in the central library.
[9] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (ii) The Pirated Library Copies. Such piracy of otherwise available copies is inherently, irredeemably infringing even if the pirated copies are immediately used for the transformative use and immediately discarded.
[10] 原文:THE NATURE OF THE COPYRIGHTED WORK - Here, Anthropic accepts that all of Authors’ books — all published, whether non-fiction or fiction — contained expressive elements (Reply 9)……The second factor points against fair use for all copies alike.
[11] 原文:The main function of the second factor is to help assess the other factors: to reveal differences between the nature of the works at issue and the nature of their secondary use (above), and to reveal any relation between the amount and substantiality of each work taken and the secondary use (next)
[12] 原文:THE AMOUNT AND SUBSTANTIALITY OF THE PORTION USED. A. THE COPIES USED TO TRAIN SPECIFIC LLMS - Here, once again, there is no allegation of any traceable connection between the Claude service’s outputs and Authors’ works. The copying used to train the LLMs underlying Claude was thus especially reasonable.
[13] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (i) The Purchased Library Copies Converted from Print to Digital. – The purpose of the copying was to keep them in its library but with more favorable storage and searchability properties. Copying the entire work was exactly what this purpose required. There was no surplus copying. The source copy was destroyed. The third fair use factor favors fair use for the purchased library copies converted from print to digital.
[14] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (ii) The Pirated Library Copies. - For the pirated library copies, however, Anthropic lacked any entitlement to hold copies of the books at all …… The third factor points against fair use for the pirated library copies.
[15] 原文:THE EFFECT OF THE USE UPON THE MARKET FOR OR VALUE OF THE
COPYRIGHTED WORK. THE COPIES USED TO TRAIN SPECIFIC LLMS. - The copies used to train specific LLMs did not and will not displace demand for copies of Authors’ works, or not in the way that counts under the Copyright Act. Again, Authors concede that training LLMs did not result in any exact copies nor even infringing knockoffs of their works being provided to the public. But Authors’ complaint is no different than it would be if they complained that training schoolchildren to write well would result in an explosion of competing works. This is not the kind of competitive or creative displacement that concerns the Copyright Act. The Act seeks to advance original works of authorship, not to protect authors against competition.
[16] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (i) The Purchased Library Copies Converted from Print to Digital. The format change did not itself usurp the Authors’ rightful
entitlements.This factor is thus neutral for the purchased library copies converted from print to digital.
[17] 原文:THE COPIES USED TO BUILD A CENTRAL LIBRARY. (ii) The Pirated Library Copies. The copies used to build a central library and that were obtained from pirated sources plainly displaced demand for Authors’ books — copy for copy. First, Anthropic argues that “Claude’s services do not reduce [or usurp] the value of Plaintiffs’ works through substitution in their traditional markets” (see Br. Expert Peterson ¶ 33). But stealing pirated copies of Authors’ works plainly did.
[18] Kadrey v. Meta Platforms, Inc., 3:23-cv-03417:https://storage.courtlistener.com/recap/gov.uscourts.cand.415175/gov.uscourts.cand.415175.598.0_1.pdf
[19] 原文:This factor favors Meta. There is no serious question that Meta’s use of the plaintiffs’ books had a “further purpose” and “different character” than the books—that it was highly transformative. The purpose of Meta’s copying was to train its LLMs, which are innovative tools that can be used to generate diverse text and perform a wide range of functions. Cf. Oracle, 593 U.S. at 30 (transformative to use copyrighted computer code “to create a new platform that could be readily used by programmers”). Users can ask Llama to edit an email they have written, translate an excerpt from or into a foreign language, write a skit based on a hypothetical scenario,
or do any number of other tasks. The purpose of the plaintiffs’ books, by contrast, is to be read for entertainment or education.
[20] 原文:The second factor, however, “has rarely played a significant role in the determination of a fair use dispute.” Google Books, 804 F.3d at 220. And it applies “with less force” when the copied works have already been published and the secondary user therefore cannot interfere with the creator’s right to control the first public appearance of their work. VHT, Inc. v. Zillow Group, Inc., 918 F.3d 723, 744 (9th Cir. 2019) (quoting Kelly, 336 F.3d at 820). So the fact that the second factor favors the plaintiffs doesn’t mean much for the analysis as a whole.
[21] 原文:In any event, this factor favors Meta, even though it copied the plaintiffs’ books in their entirety. The amount that Meta copied was reasonable given its relationship to Meta’s transformative purpose. See Oracle, 593 U.S. at 34. Everyone agrees that LLMs work better if they are trained on more high-quality material. See Ungar Decl. ISO Meta MSJ ¶¶ 42–48; Pls. Reply Ex. 115 ¶¶ 79–80. So feeding a whole book to an LLM does more to train it than would feeding it only half of that book. With this in mind, it was “reasonably necessary” for Meta to “make use of the entirety of the works.” HathiTrust, 755 F.3d at 98.10
[22] 原文:Neither party’s expert opined that Llama was able to regurgitate more than 50 words from any of the plaintiffs’ books, even in response to“adversarial” prompting designed specifically to make LLMs regurgitate…….Llama’s ability to regurgitate miniscule portions of the plaintiffs’ books if manipulated into doing so does not threaten to have a “meaningful or significant effect ‘upon the potential market for or value of’” the plaintiffs’ books. Id. (quoting 17 U.S.C. § 107(4)).
[23] 原文:The plaintiffs’ primary theory of market harm is that Meta’s unauthorized use of their
books for LLM training harms the market for licensing their books for that purpose. But whether such a market exists or is likely to develop is irrelevant, because this market is not one that the plaintiffs are legally entitled to monopolize.
[24] 原文:Given the state of the record, the Court has no choice but to grant summary judgment to Meta on the plaintiffs’ claim that the company violated copyright law by training its models with their books. But in the grand scheme of things, the consequences of this ruling are limited. This is not a class action, so the ruling only affects the rights of these thirteen authors—not the countless others whose works Meta used to train its models. And, as should now be clear, this ruling does not stand for the proposition that Meta’s use of copyrighted materials to train its language models is lawful. It stands only for the proposition that these plaintiffs made the wrong arguments and failed to develop a record in support of the right one.
[25] 原文:Relatedly, Meta argues that the “public interest” would be “badly disserved” by preventing Meta (and other AI developers) from using copyrighted text as training data without paying to do so. Meta seems to imply that such a ruling would stop the development of LLMs and other generative AI technologies in its tracks. This is nonsense.
[26] 参见李琛老师:《论我国著作权法修订中“合理使用”的立法技术》,载《知识产权》 2013 年 01 期 第 12-18 页:在现实中,著作权人往往不是作为个体的实际创作者,而是商业组织,他们具有很强的游说立法的能力。相反,作为使用者的社会公众由于力量的分散,缺乏统一有力的意见代表,反而在立法博弈中居于弱势,因此司法机关有必要在个案的利益平衡中发挥更大的作用。田村善之认为,引入著作权限制的一般性条款的真正意义在于,将著作权限制的具体化任务从立法转移到司法。

请先同意《服务条款》和《隐私政策》