::: block-1
“时问桫椤”是一个致力于为本科生到研究生教育阶段提供帮助的不太正式的公众号。我们旨在在大家感到困惑、痛苦或面临困难时伸出援手。通过总结广大研究生的经验,帮助大家尽早适应研究生生活,尽快了解科研的本质。祝一切顺利!——时问桫椤
非常感谢各位的点赞关注和转发,你们的点赞和关注是我更新的动力
:::
摘 要:
以ChatGPT-4为代表的新一代生成式人工智能迅速普及,其“作品”的可版权性也备受争议。我国近期的AI文生图著作权侵权第一案,肯定了涉案AIGC“春风送来了温柔”的作品属性,无疑鼓舞了生成式人工智能的新业态。但个案裁判与规则化的认定标准,在效力上仍然相距甚远,不应因此便盲目乐观。从制度上构建AIGC作品认定的一般规则,仍是新业态发展亟待解决的问题。在AIGC超强“智能性”旨在深度理解“人类指令”,并非缔造独立创作主体的逻辑前提下,还原生成式人工智能在新型“人机合作”中的“工具地位”。以“提示工程”代表“自然人创作”的法律定性为逻辑起点,准确开展AIGC可版权性一般规则的构建,确立AIGC专门作品类型,避免出现提示词输入等于画家创作的常识性悖论。
关键词:生成式人工智能;AIGC;可版权性;一般规则;
ChatGPT-4的“强智能性”使生成式人工智能迅速走入公众视野。生成式人工智能“作品”(简称AIGC)的新业态发展,却阻滞于是否属于人类创作的可版权性逻辑困境。我国“AI生成图片著作权第一案”,虽然以司法裁判的方式为涉案作品提供了著作权保护,但也引发了“人人皆可成为画家”的新型争议。同时,个案判例因非正式法渊源的属性,并不代表着AIGC这一庞大“作品”类型的可版权性问题从此迎刃而解。相反,还滋生了“提示词输入等于绘画技艺”的担忧。这一切都需要回归生成式人工智能创作行为的技术逻辑,来重新审视“提示工程”1的法律定性,以及“提示工程”输出作品与现有著作权作品的界分,并在这一逻辑起点上完成认定标准的一般规则构建,为AIGC新业态发展划定行为尺度。
一、AIGC可版权性一般规则构建的现实需求
美国Open AI公司开发的ChatGPT-4引发了生成式人工智能的热潮。ChatGPT-4以其强人机交互性、高度自主完成性,引领生成式人工智能以多模态原创性形成诸多新业态。[1]P70围绕AIGC的多元化应用也不断涌现,例如绘画生成工具“百度飞桨”、换脸图片及视频生成工具“ZAO”、文字与图像样式转换工具“NightCafe”等。可以说,ChatGPT-4代表的生成式人工智能在大语言模型和扩散模型的随机输出模式下,[2]P706通过对指令要素的多元化深度挖掘和开放域的无序数据处理,使AIGC从结果上高度逼近人类创作且难以区分。据统计,无界AI平台中,仅AIGC绘画作品的单项数量便已超过1.2亿。AIGC文本、音乐、视频等创作类型更是不计其数。
伴随着版权新业态的发展,AIGC带来的可版权性争议也在技术热潮中层出迭见。2023年2月,美国版权局(USCO)在“Midjourney案”中,认为用户在利用Midjourney生成漫画图像时,并没有自然人的创造性投入,而是由Midjourney系统自动生成,因此该漫画图像并不构成作品,否认了AIGC的可版权性。[3]2023年8月,塞勒利用Creativity Machines生成了作品《天堂的新入口》,在申请版权注册登记时同样遭到USCO的拒绝,其起诉后法院仍裁定AIGC不受著作权保护。[4]该案以判例的法律续造功能,为美国的AIGC可版权性制定了准则。截至2023年底,USCO已先后四次拒绝AIGC的版权注册登记申请。Midjourney是全球排名前十的生成式人工智能平台,可版权性的否定,意味着每天数以万计的AIGC都无法通过版权登记来确权与保护。这对其他AIGC新业态企业而言,无疑是雪上加霜。
如今,AIGC已经被广泛应用于新闻撰写、艺术绘画、音乐影视以及文学创作领域,AIGC数字藏品等新业态纷至沓来,呈井喷之势,应用与交易市场日趋成熟。2023年,我国AIGC市场规模可达170亿人民币;[5]商汤科技“数字猫APP文创平台”限量发售的2300份生成绘画《宋人匹马·徐悲鸿》,一经上架便迅速售罄;[6]由百度文心一格续画的陆小曼未尽稿以高价落槌成交;[7]2023年上海国际电影电视节收到586张AIGC海报;[8]2022年6月,百度数字人度晓晓的4幅AIGC画作被打造为数字藏品,仅24小时交易额便超过17万元;[9]视觉中国也先后发售134个AIGC数字藏品。[10]AIGC数量规模与经济价值的爆棚式增长,不断深化着著作权法“回应新技术、新业态发展的需求”。
其实,我国早在2019年4月就出现首例针对计算机软件智能生成内容的作品认定判例(简称“智能生成报告案”)。该判例以涉案分析报告虽具独创性,但生成主体并非自然人为由,否认其作品属性。2该判例援引的“自然人创作主体”,表明法院坚持人类作者主义的立场,这也是后来AIGC可版权性争议的焦点。近期,北京互联网法院开庭审理了“AI文生图”著作权侵权纠纷一案。原告李某利用Stable diffusion, 通过输入提示词的方式,生成一张人物图片,名为“春风送来了温柔”。被告刘某未经许可在个人账号上使用了该图片,被提起侵害作品署名权和信息网络传播权之诉。最终法院以提示词的选取与设计、参数的调整、对话修正等“提示工程”属于人类“独创性”劳动为由,认可涉案AIGC的可版权性。3该案给AIGC新业态带来鼓舞的同时,也产生了三个不容忽视的问题,反映出制定一般规则的现实需求:
第一,AIGC著作权司法审判应统一裁判标准。
根据以上两个结果相反的案例,可以看出,裁判过程中法院始终坚守人类作者主义。是否由人类完成创作,是AIGC可版权性的共同关注。“智能生成报告案”认可涉案报告的独创性,却否认“参数调试”“模型选取”“生成目标设定”在创作过程中的作用。“生成主体并非自然人”的司法判定,间接承认了涉案报告是由机器自主完成创作,AI系创作主体的论断。而在“AI文生图案”中,法院亦坚持人类创作是可版权性的前提,却将“提示工程”视为人类独创性劳动的一部分,肯定了可版权性。“AI文生图案”成功将“AI生成内容是否为人类创作”的焦点,具化为AIGC创作行为是否包含自然人的创作性劳动,从逻辑上回避了人机关系的主、客体之争。该案以“提示工程”为逻辑起点,判定AIGC包含人类“独创性”劳动,顺理成章地将创作主体从机器转回人类。该案中确定的裁判逻辑,如果能全面适用于所有生成式人工智能,那么任何一个具体的AIGC版权认定,都不需要再将“是否为人类创作”视为争议焦点,只需要判定具体AIGC是否在客观上“区别于现有作品”即可。盲目乐观容易忽视个案判例的局限性。“AI文生图案”中确立的裁判标准,在成文化规则主义的法律语境下属于非正式渊源,可以为AIGC的利用尺度提供风向标,却无法规则化强制适用于其他司法判例。况且,相反认定的判决案例也有同样的示范功效。通过个案为同类争议确立裁判标准,无疑不利于“同案同判”的初衷。因而,以“AI文生图案”所确立的裁判标准,来构建AIGC可版权性一般规则,是进一步明确并统一裁判标准的必然选择。
第二,“提示工程”在AIGC创作中的法律属性应规则化明确。
ChatGPT-4是新一代生成式人工智能的代表,建立在自然语言处理大模型之上,需要通过“人机对话”完成创作指令的输入和创作参数的调试。提示词的选取与设计、参数的调整、对话修正等都属于“提示工程”的范畴。特别是提示词的选取与设计,是“提示工程”的核心所在,直接决定着生成结果的内容、方向和质量。甚至有人认为,AIGC新业态必将催生“提示词设计”的新兴职业。[11]P1-2虽然“AI文生图”案肯定了“提示工程”创作劳动属性,但由于缺少对“提示工程”法律属性的规则化界定,难免因提示方式、提示频次等问题再次陷入经久未平的理论争议。
自AIGC版权新业态问世以来,学界便存在关于输出内容可版权性的对立争议。分歧点在于AIGC的“独创性”到底来自人类智慧还是来自“作品”自身的独特表达,也可归结为主、客观独创性之争。坚持主观论者认为,“作品源于作者独立的、富有个性的创作,打上了其聪明才智的独特烙印, 是作者精神与意识的产物”,[12]P150AIGC因“作者精神”的缺乏不具备可版权性。反之,客观论从“作品”本身出发,认为“当人工智能创作物在表现形式上同人类创作作品完全一致,以至于如果该作品是人类创作完成,则毫无疑问可以被授予版权时,我们无需考虑该作品的创作者是人工智能还是自然人的问题”。[13]P138只要作品本身符合可版权性的法律要求便可以获得版权保护。主、客观独创性的学理争议在于要不要突破人类创作的独创性前提,而忽视人类早已通过“提示工程”参与AIGC的创作行为,甚至对AIGC的独创性具有主导和决定意义。需要注意的是,这一理论争议并未随着“AI文生图案”的宣判而“定分止争”。“提示工程”的法律定位亟待通过一般规则来最终确定。
第三,AIGC作品与传统作品之间的界分。
“AI文生图案”对“提示工程”的人类独创劳动属性进行了司法确认,也带来了“人人皆可为画家”的新型争议。该案为“春风送来了温柔”提供了著作权确权与司法保护。但基于个案的局限性,判例没有对属于何种类型的作品、是否与传统作品同等保护等一系列问题做出更进一步的解释。“提示工程”下的AIGC绘画创作行为,在法律效果上等同于画家的亲手描摹与勾勒等,让社会公众因常识性悖论,对法律裁判的合乎逻辑性产生质疑。
人类作者以作品是精神世界的思想、情感外化为由,确立了“作者-作品”的著作权法律结构。不同类型作品所对应的人身创作行为,是人格利益存在的有力印证。而AIGC带来的创作方式转换,使传统创作中精神、人格对作品的附加路径发生了颠覆性变化。美术作品领域,绘画技艺被文字输入所替代。这种变化是否会影响著作权法判定人格利益的存在,或者将其与传统创作方式所负载的人格利益加以区分,却无明确界定。这是裁判结果合理性争议的关键所在。
著作权法的诞生源于对人类作者“创作劳动”的尊重。保护人类创作是著作权法显而易见的逻辑起点。“春风送来了温柔”也是因为存在“提示工程”这一人类创作性劳动,才得以受到司法保护。“提示工程”是人类智慧主导AIGC作品创作的媒介,已被司法确认。可以说,生成式人工智能在“亲手描摹”之外,为公众提供了“提示工程”这一新的创作路径。根据判例所示,二者都属于人类创作的范畴。但我们也不得不承认,生成式人工智能通过“提示词”转化为绘画内容的创作,与“亲手描摹”的绘画技艺存在着本质区别。后者因“绘画技艺-绘画行为-绘画作品”的常识性逻辑,不存在AI转化的中间环节,附着更强的人格利益。然而,“AI文生图案”的司法裁判结果,却将“提示工程”与“亲手描摹”等同起来。其未考虑身体行动的绘画技艺与提示词转化的工具应用之间在作者人格利益上的差异,便给予同等的保护,令人产生“人人皆为画家”的疑问。当然,差别保护的前提是,对于AIGC作品设置了区别于传统版权作品的专门类别。这显然超出了个案裁判的能力范围。因此,制定AIGC可版权性一般规则,明确AIGC与现行法定作品之间的界分,已成必然。
在AI已不可避免“侵入”社会生活全链环节的算法时代,不难发现“唯自然人创作主体论”在审视生成式人工智能“作品”可版权性,没有遵从公共政策所提倡的包容与开放性,反而表现出考察人类作品“独创性”时从未出现过的保守主义,即“唯自然人创作主体论”的逻辑自限。法律作为现行社会的治理规范,应当从时代发展的主题中推导出自身的合理性和有效性。公共政策中已经确认的技术需求,也理应成为法律回应时代的迭代动因。生成式人工智能“作品”在“新业态知识产权保护”的时代背景下,即便不能引起著作权法“作者主义”核心结构的变更,也至少应当在“独创性”来源的“唯自然人创作主体”考量中,避免出现保守主义之下的自限性。要打通“作者主义”下AIGC可版权性的逻辑理路,就需要对“唯自然人创作主体论”产生逻辑自限的原因进行路向检验,使“作品”判定的逻辑语境回归澄清。
二、AIGC可版权性一般规则构建的路向检验
我国《著作权法》第3条和《著作权法实施条例》第2条,共同搭建了作品构成的要件制度,将“独创性”和“非除外事项”作为判断作品属性的核心要素。此外,美术作品还需要具备审美价值。独创性标准因缺少明确的规则,一般围绕“独”和“创”来进行考量。“独”可以解释为“不对他人作品进行抄袭或复制”。[14]P21“创”要求作品体现作者构思、思想或者感情。AIGC在客观上可以“区别于现有作品”,已经被司法裁判所确认,主、客观论在这一点上也并无争议。矛盾的焦点在于“创”。
18世纪之前,“作品被认为是对先验的模仿”,[15]P63人类创作则是对上帝的改良。18世纪以后,人类作者以“作品为内心世界思想、情感外化表达”的理念,赢得了著作权斗争的胜利。英国著名的书商论战,以自然人为中心确立了“作者-作品”的著作权法律结构。“作者主义”下的“作品来源于自然人”也由此成为独创性判断中的默会立场。“创”作为人类的专属活动,是精神权利斗争的结果,本无可厚非。然而,“作者主义”在面对ChatGPT-4为代表的新一代生成式人工智能时,却因理论延伸中的路向错误,得出了可版权性的否定结论。
虽然“AI文生图案”首度承认“提示工程”属于创作性劳动,但“提示工程”属于“程序代码规则化运算”的技术本质仍使争议不断。要将个案裁判确立的标准上升为一般规则,必然要回到生成式人工智能的技术原理,对“作者主义”否定AIGC可版权性的理论路向进行检验,为一般规则的构建扫清理论障碍。
(一)“非自然人来源”的假定误区
“作者主义”下“作品来源于自然人”的法律立场,天然排斥“在人类之外认定作品独创性来源”。4AIGC创作行为中的人为因素,几乎都来源于“提示工程”。“提示工程”在技术语境中,是替代自然语言模型微调,而采取的提示词选取、对话问题设置等,引导模型提升输出效果的操作方式,与算法模型有着密切的互动关系。“提示工程”可以有效避免模型微调带来的数据成本增加与模型通用能力减退,被视为操作算法模型的技术行为。因而这一人为因素在机器创作的表象下经常被忽视。其在法律语境中与独创性劳动的关联,缺少法理上的逻辑证成。这也是生效判决仍存在争议的原因。
“非自然人来源”论者否定“提示工程”在法律上的创作属性,将AIGC视为生成式人工智能依据算法模型而输出的“要素组合”。[16]P111美国著名的猕猴自拍照案,5常被用来类比解释AIGC的“非自然人来源”。该案在认可猕猴自拍照具有与人类创作的“外在不可区分性”、与现有作品相比的表达独特性,甚至认可该自拍照中包含猕猴“个性选择与判断”的同时,以“非自然人来源”为由否认客观独创性所构筑的可版权性路径。该案与我国“智能生成报告案”的裁判逻辑基本一致。“最低限度创造性”“经济价值”“公共需求”等法教义学上的独创性判断要素,在“非自然人来源”面前变得毫无意义。也就是说,当“背后的自然人”不复存在,“作品”本身的客观独创性,无法独立支撑可版权性。
“作品客观独创性”理论尝试通过推翻“作者主义”,为AIGC的可版权性开辟路径。然而,“作者-作品”的著作权法结构模式,使“自然人来源”成为作品可版权性的逻辑起点。菲尔丁认为“简单抄袭模仿的文章不应被视为财产”,[17]P132爱德华·扬格则认为“模仿常常运用技巧、技艺和劳作,靠现成的材料去制作,而不是从他们自身汲取灵感”。[18]P6以作者为中心的著作权是创作主体权益斗争的结果,作者赋予作品的精神利益与人格属性,是作者权正当性的法理基础,法律必然要确保作品的“人格化”特质。[19]P44这是整个著作权制度的基石,不应简单以回应生成式人工智能的技术挑战为由而轻易推翻。“作品客观独创性”理论无法完成逻辑推演中的合理性自洽。但是,对“作品客观独创性”的否定,也并不意味着AIGC与猕猴机缘巧合下的自拍照一样都缺乏人类创作的本意。猕猴“自拍照”属于偶发意外事件,而AIGC的创作行为却包含着“提示工程”的人为因素。正是由于“作者主义”否认“提示工程”属于独创性劳动,才使AIGC的可版权性陷入“非自然人来源”的逻辑困境,其核心表现便是“假定前提”的附加。
究其原因:第一,“作者主义”是在技术语境下理解“提示工程”的,将其视为机器运算中的一环,从属于模型运算过程;第二,“作者主义”在AIGC可版权性的逻辑推演中,形成“机器独立完成创作”的“假定前提”。其逻辑推演过程大致如下:首先,作品输出的终端环节来源于机器行为;其次,在遮挡的条件下作品难以判断来源于人类还是机器;最后,因无法准确判定来源,机器行为的输出具有可比拟于人类的“智能性”。这一推演过程无疑是遵从图灵测试哲学路径的结果。当无法简单判定AIGC源于人类还是机器创作,其客观上又具备独创性,并由生成式人工智能机器完成创作,那么AIGC客观上的独创性则来源于机器。“假定前提”的存在是“非自然人来源”陷入路向误区的根本原因。而“假定前提”的形成,却与“作者主义”对“提示工程”作用的忽视密不可分。
要彻底解决“非自然人来源”的路向误区,为AIGC可版权性一般规则的构建扫清理论障碍,需要分别从“假定前提”自身的逻辑瑕疵,以及“提示工程”作用被忽视的原因中寻找突破口。
“假定前提”生成逻辑中显而易见的矛盾之处在于:以“非自然人来源”否定AIGC可版权性的主张,大多遵从图灵测试的哲学路径,采用了“机器独立完成创作”的“假定前提”,却同时在证明机器创作不具有“人类精神”属于“非自然人来源”时,运用了主旨相悖的塞尔“中文屋试验”理论。其推理过程大致包括三步:第一,设置“前提假定”,即以“图灵测试”为标准,认定生成式人工智能独立完成AIGC创作。第二,“中文屋试验”原理的介入,即生成式人工智能独立完成AIGC的过程,属于算法规则化运算的结果,不具有人类创作意图。第三,结果的判定,即AIGC比拟于人类创作的独创性是算法运算的结果,属于“非自然来源”,不具备可版权性。
自相矛盾是“假定前提”生成逻辑中无法修饰的瑕疵。首先,这一逻辑过程中先后包含了“图灵测试”对智能的肯定,和“中文屋试验”对智能的否定,两个相互矛盾的哲学基础,导致推理过程在逻辑起点上就具有矛盾性。其次,塞尔的“中文屋试验”理论既然否认机器可以逼近人类智能,那么在机器独立创作下,又怎么会出现达到人类创作效果的AIGC作品呢?AIGC中堪比人类创作的元素不可能来源于机器,又如何在机器独立完成创作的前提下出现的?
塞尔的“中文屋试验”是对图灵“结果主义”智能判断的深刻反思。“只要程序是根据在由纯形式定义的元素上进行的计算操作来定义的,这些操作本身同理解没有任何意义的联系。”[20]P77“中文屋试验”的结论为,“即便通过了图灵测试,如果没有意向性,就表明机器仍不具有心智。图灵认为计算即思维,塞尔认为智能不在于形式的转换,而在于能处理内容或有意向性”。根据塞尔的“中文屋试验”可以反推出:AIGC的独创性不可能来源于机器,则达到人类创作效果的AIGC也不可能由机器独立完成。本应是“假定前提”破除的有力证明,却在“作品来源于机器”的前提下,被用来证明AIGC的“创作”过程只是算法对“喂料”的组合与加工,因而即便客观上达到了人类创作的效果,也不能成为著作权的客体。
不难发现,“机器独立完成创作”的“假定前提”,在判定AIGC不可版权性时,还存在一个无法回避的逻辑漏洞:独创性的概念偷换。AIGC要达到人类创作效果,必然要符合人类创作的独创性要求。“作者主义”下的独创性,不仅仅是指“区别于现有创作”,这只是“独”的含义,而“创”是人类的专属活动,要求作品体现作者构思、思想或者感情。“作者主义”承认AIGC可以达到人类创作效果,具有独创性,又同时否认这种独创性来源于人类。前者在类比人类创作时被承认的独创性,是兼具“独”和“创”的;后者被否认的独创性则仅有“独”的含义。且不论“作者主义”对脱离于人类的“创”从未认可,即便是同一语境下同一概念的内涵不一,便已无法自圆其说。去除“假定前提”,“非自然人来源”的假定误区便迎刃而解。那么,AIGC比拟于人类创作的独创性则必然出自于人类。但仅凭这一点,尚不足以修正“作者主义”在否定AIGC中的路向问题。深究假定误区产生的原因,“提示工程”认定中的语境偏差是首要因素。要彻底修正“作者主义”在判定AIGC可版权性中存在的路向问题,还应当修正“提示工程”这一人为创作因素在法律认定中的语境偏差,实现“提示工程”在技术和法律上的逻辑贯通。
(二)“提示工程”认定中的语境偏差
“作者主义”下的“非自然人来源”在面对AIGC的可版权性认定时,还表现出极强的解释自限性,其将创作行为限缩至“创作过程的完全自然人来源”,要求创作意向与创作行动都同时作用于AIGC,并以此否定“提示工程”在法律上的地位。这一点在大多数以机器智能为计算逻辑,而否定AIGC具有创作构思或情感的论述中数见不鲜。要明确“提示工程”在法律上的地位,需要从技术原理出发,重新认识“提示工程”在AIGC创作过程中的人为主导性。
从技术层面来看,生成式人工智能是算法的一种。其“在数据采集与训练的基础上,依据特定的运算规则输出结果,以完成目标任务”,是“程序设计+数学规则”的集合。[21]P54“提示工程”则是生成式人工智能在算法运算过程中,由人为因素参与的一环。
生成式人工智能的核心是大语言模型和扩散模型,通过上下文学习、代码自动补全来实现“生产性”的内容输出。OpenAI、Google、Meta、Salesforce等开发的生成式人工智能模型或工具,具有模仿、共情以及引用任何先前沟通或情境下具体内容的能力,在生成图像、文本、视频和音频等方面可以媲美于手工编写的效果,很容易使公众误解生成式人工智能在独立自主地完成创作。生成式人工智能作为一种交互式AI,以自然语言处理模型为基础,数据训练的过程聚合大量的原材料,具备对专业化知识的详细借鉴能力,甚至为了满足具体的用户指令,可以衍生出复杂的源代码或机器代码,并运用指令所属领域的专业知识来完成对专业问题的推理回答。生成式人工智能除模型自我优化式的知识分布采样与深度处理能力外,还在人类反馈中进行反复的强化学习训练(Reinforcement Learning from Human Feedback),从而获得包括需求、信念与意图在内的主观倾向。对生成式人工智能的“大脑”进行技术结构分析,不难发现,其自然语言模型的运转,通常包括自然语言交互、知识、记忆、推理与计划、转化与生成五个逻辑环节。[22]P12-21其中,“自然语言交互”环节是运行逻辑的起点,也是高质量生成和深度理解的来源。而“知识”“记忆”“推理与计划”环节,则主要通过模型下的数据分析以及对记忆数据的重复训练,以保证“推理与计划”过程的“连续性”和“自我完善性”,形成针对“定制”需求的内容生成计划,并在上下文学习中完成内容的输出。这一逻辑运行范式足以证明以ChatGPT-4为代表的生成式人工智能,建立在分步引导式的人机交互关系中。其“创造性”的表象来源于开放式的数据挖掘与训练,以及针对指令需求自我优化时所体现出的“主观性”。除此以外,生成式人工智能克服了传统AI在预设知识中完成检索与答案输出的“预设任务”模式,可以实现将解答从预设的任务转移给具有类似语义的非预设任务。也就是说,生成式人工智能的内容“创造性”体现为开放域、模型自我优化、预设问题答案的迁移应用。它们共同塑造了生成式人工智能可以自行完成“创作”的假象。
虽然生成式人工智能以开放域的数据检索和代码自我优化能力,可以实现对非预设问题的解答,并且以存储知识为基础,对人类反馈进行迭代学习,使生成内容尽量符合人类的主观需求,具有一定的自主“创造力”,但同时也不难发现,AIGC的创作过程无论是前提还是经过,都离不开“提示工程”。在技术语境下,“提示工程”的实现路径包含迭代式需求交互、分步式引导和人工智能对齐等关键技术环节。至少在现有的生成式人工智能通用技术中,迭代式需求交互引导下的生成过程,直接包含了人为因素的参与,甚至运行逻辑中的环节流转也是在人为的分步式需求指令发布过程中实现的。“提示工程”引导着生成式人工智能完成知识选取、代码优化,并在交互中引导机器的生成计划,为生成内容提供人类“主观的”目的性和方向性。这些通过“提示工程”融入AIGC创作的人为因素,是生成内容的导向和灵魂。开放域中海量的预设型问题答案是生成式人工智能知识检索与“类似迁移”的前提;控制模型自我优化的人工智能对齐技术,可以保障生成内容符合人类意图;从类似问题的预设答案中寻找非预设问题的解答方案,来源于对人类持续反馈的强化学习。[23]P752可以说,在不断推测与满足人类需求的过程中,AIGC才具有了人类“主观性”的特征。
剖析AIGC的生成过程,机器并不是真正理解了提示词本身的含义,而是根据提示词去大数据当中寻找相关的数据,再根据用户提出的需求对这些数据进行处理。对于需求本身的理解,也是通过关键词来寻找最大相似度的数据经验理解。ChatGPT-4的自主生成表象主要来源于:将在先步骤的“需求-输出”匹配经验,迅速转化为对人类反馈的经验性“知识”。它并不像人脑一样理解了某个概念的真正含义,而是通过匹配的经验,从类似问题的预设答案中寻找匹配项,根据经验“知识”在众多可能的匹配项中,推测哪个最能满足指令需求,然后推送给指令发布者。给出的解答如果不符合指令者的需求,则需要通过下一步的指令引导,来完成进一步的查找和组合。这充分说明生成式人工智能本质上并不具备主观创造力。一旦生成了一个区别于现有创作的“作品”,也不可能是机器能动创作的结果。机器本质上还是在想方设法地帮助人类,“组合”出自己想要的答案。这足以说明ChatGPT-4本质上仍然是人类创作的辅助工具。
以“非自然人来源”来反对AIGC可版权性的理论,还将ChatGPT-4生成内容的“非预知”和“不可控制”,作为“作品来源于机器”的依据。根据运行逻辑可知,“结果输出的随机性”并不能排除“提示工程”的分步主导以及对结果的干预。虽然以ChatGPT-4为代表的生成式人工智能,最终生成什么样的结果,并不具有完全的预见性和可控性,即输出结果的不稳定性——指令发布者会发现,哪怕输入的提示词意思很接近,也可能会得到完全不一样的结果——但这也不足以推翻其创作辅助的工具属性。因为,在生成式人工智能的技术逻辑中,内容生成的起点和终点之判定权,均掌握在指令者手中。只有当指令者判定生成内容已经符合指令需求时,内容生成才算完成。当输出结果被判定不满足需求时,人类会不断发布新的指令来指导其进行内容优化,直至满足主观需求。在此之前,生成式人工智能需要不断推进,客观生成内容逼近人类创作的主观构想,以客观结果去迎合主观意图,是ChatGPT-4无法逃离的宿命。这说明创造的程度和方向是由人决定的,生成式人工智能在人类的引导下分步式完成结果输出,只是便捷化满足人类创作设想的工具。当人类用ChatGPT-4来进行创作时,往往有一个预设的“蓝图”,ChatGPT-4只能在分步的引导下帮助人类实现这个“蓝图”而已。也就是说,人类对生成内容带有目标期望,这种目标期望可能会根据每一步的反馈进行动态调整,但并不能因为期望的动态调整,而否定最终的生成结果是在追随人类意向性表达中完成的。人类的主观因素对生成结果具有主导作用。也正是由于人类因素的主导,ChatGPT-4的生成内容才从“知识”“记忆”“推理与计划”环节的随机性状态,转为输出环节的唯一确定状态。内容生成的过程,来源于人类输入什么样的引导词或提示词,生成的结果来源于人类对生成内容“是否满意”的主观判定。这些都足以说明“提示工程”在创作中的主导地位。
因此,目前的生成式人工智能,无论表现出多么智能化的“创作能力”,都难以摆脱人类创作工具的属性,更不可能作为另类主体与人类分庭抗礼。ChatGPT-4无法独立完成创作活动,这决定了其并没有上升为人类以外的新型创作主体。在确立“提示工程”对创作的主导地位下,ChatGPT-4并没有摆脱“自然人来源”,AIGC只要同时符合“区别于现有创作”等要素,则应当认定为满足了独创性的要求。
“作者主义”对AIGC可版权性的否定,往往以“人类并未全程参与创作活动”“机器具有高度自主性”等为由,陷入对“提示工程”的过度技术化解读,认为“提示工程”是机器运算的附庸。然而,生成式人工智能的技术逻辑,向我们展示了ChatGPT-4的高度智能性,并非体现在独立完成创作,而是集中于如何精准理解人类指令,例如类似迁移技术,以及如何精准满足人类要求,例如人工智能对齐技术。
生成式人工智能无法独立预设生成目标,无法脱离人类而自主开始并结束创作,仍属于有限自主性的弱人工智能。没有“提示工程”的人为因素参与,即便是Midjourney、Discord Diffusion等排名前端的智能应用,也无法完成AIGC。其实,在生成式人工智能以前,人类利用计算机软件与数据模型辅助创作的情况并不少见,独创性标准从未因工具在创作过程中的介入而有所改变。“作者主义”对ChatGPT-4高度智能性作用的误解,使“提示工程”作为主导创作的人为因素被忽视。技术语境下对“提示工程”的解读,被直接运用于法律认定,导致“提示工程”与创作劳动之间的关系被割裂。因此,法律应当在现有技术逻辑下,结合生成式人工智能的工具属性,重新审视“提示工程”的法律地位,确认“提示工程”是人类因素主导创作行为的媒介。
三、AIGC可版权性一般规则构建的逻辑起点
“法学理论中所追求的同案同判,绝不是两个案件的数个甚至全部的单列特征相同,而是可被涵摄于相同法律规则之下的案件,实现法律要点上的相同评价。”[24]P43同案同判是司法自然正义的内在要求。在我国的法律语境中,一般规则的构建不仅“为个案生成判例坐标”,还可以通过规则预设来完成类案下的同案同判,“确保当事人在个案中感受到公平正义”。[25]P66AIGC的“作品”模态多元,“文生图”仅是其中一种。在个案判例无法系统化确立相关规则的情况下,一般规则的体系化构建对于新业态发展与纠纷化解具有重要意义。
通过路向检验,发现并修正“作者主义”在AIGC可版权性认定中的路向偏差,为构建AIGC可版权性一般规则扫清了理论障碍,同时也锚定了制度架构的逻辑起点。AIGC的可版权性认定,应当回归“技术-法律”贯通的逻辑框架,避免“作者主义”对新兴技术的保守主义,实现我国《著作权法》默会立场与制度创新之间的平衡。
(一)明确生成式人工智能的工具属性
“作者主义”下“作者-作品”的著作权保护范式,以洛克的劳动价值理论、康德和黑格尔的人格权理论等,为作者的专属权利提供正当性支撑。其中,人类的聪明、才智成为创作劳动的核心与灵魂。也正是由于人格利益与劳动行为的叠加,人类才脱离上帝成为著作权的主体。在传统以法律关系为核心的人类中心主义范式下,人类是当然的法律主体。除法律拟制外,其他存在都只能作为客体或者工具。猕猴自拍照引发著作权争议的核心在于:猕猴自拍的“意外”过程,是在猕猴独立的行动下完成的。因而猕猴从事实上成为了该自拍照的创作主体。因没有人类的参与,该自拍照的可版权性症结便在于:猕猴这一事实创作主体能否成为法律上的创作主体。法律实践以否认猕猴作者身份为逻辑起点,将猕猴与自然人并列视为创作物产生的来源,再利用《著作权法》的“作者主义”来排除非自然人的主体地位。同样的逻辑被用来分析生成式人工智能。于是,ChatGPT-4被视为可以独立完成创作的另类事实主体,与人类创作主体并列来考量法律的可容纳性。因而生成式人工智能与猕猴具有同样的命运,成为挑战自然人创作主体地位的又一外在因素。因此,生成式人工智能以“非自然人”的同样逻辑被排除在著作权主体范围之外。
然而,考察生成式人工智能的技术逻辑可知,ChatGPT-4并未摆脱人类因素的干预。甚至可以说,生成结果是在人类意志主导下完成的。这种意志性融入了从创作开端到创作经过再到创作结果的全过程。生成式人工智能不能真正独立自主生成作品,甚至达不到猕猴对人类著作权主体地位的冲击程度。完全自主决定并实施创作的生成式人工智能,在目前都只是遥远的假设。
因此,关于AIGC可版权性的立法,应当在规则设计之前,确立生成式人工智能并非独立完成创作主体的立场。并在这一逻辑起点上,破除人工智能的“万能”幻象,摒弃将其并列于人类,视为新型创作主体的理论路向,在立法上回归机器的工具本性。
(二)确认“提示工程”的人类主导性
生成式人工智能作为创作工具,在创作过程中的参与因素,确实远远高于普通的辅助工具。因此,AIGC的创作过程是合作型“人机关系”构筑的结果。反对者也经常以AIGC具有不确定性和未知性为由,将“人机合作”中的机器作用无限放大,否定AIGC独创性中包含的人类创作意向。这一逻辑使人机合作中的人类贡献被忽视或否认,即便AIGC“区别于现有作品”,也被归结为算法程序按照模板和逻辑运算对数据材料加工得出的机械性结果。“提示工程”与独创性劳动之间的关系被忽视,是“作者主义”否定AIGC可版权性理论路向的错误根源。
“意向性否定说”否认人机合作中人类因素与生成结果之间的内在联系,必然走上生成式人工智能独立完成创作的“假定前提”之路。摒除这一“假定前提”就产生另一个问题:生成式人工智能输出的作品是否包含创作意向,如果答案是肯定的,其创作意向到底源于AI还是人类?首先,生成式人工智能创作的逻辑起点源于创作意向的指令化输入。这就说明生成式人工智能本身并不具备自主化开始创作的功能,只是因为大语言模型和扩散模型的先进算法,而具有多模态输出的能力。[26]P87至于创作什么类型的“作品”以及创作什么内容的“作品”,机器并无自主决定能力。创作指令作为生成内容的开端,需要告诉生成式人工智能创作的具体目标和要求是什么,ChatGPT-4才能按照需求进行输出。这种开启智能创作的技术机制为自然语言交互。AIGC创作之所以开启,是为了满足人类的创作意向与需求,其构思也源于人类意向。其次,自然语言交互在创作过程中的节点性融入,贯穿着“创作指令理解-创作素材加工-创作程序微调-创作结果输出”的全过程。ChatGPT-4在收到人类创作指令后,需要通过迭代式需求交互的过程,来深度理解指令意向,并完成知识挖掘。当生成内容与指令需求不符时,指令者需要发布新的调整指令,便于机器优化对需求的理解,以对应性调整AIGC。在这一过程中,人工智能对齐技术承担着深度理解反复对话中的指令意向,以保证输出内容符合需求预设的功能。可见,AIGC的产出是机器不断理解与追逐人类创作意向的过程,是高度智能化工具代替人类完成创作的过程。
生成式人工智能确实包含高度的智能化因素,易使人们产生“工具异化为主体”的误解,但剖析技术逻辑便可对其智能性见微知著。生成式人工智能的“智能性”主要体现在深度理解人类创作需求方面,并非用来设计创作构思和完成自主创作。创作的意图、目标、构想等人类意向性,是脱离了“具身”的计算式人工智能思维无法企及的,仍然且只能来源于人类。在这一方面,即便是在上下文理解中能够模仿情感认知的生成式人工智能也不例外。创作结果的非预知性,不能说明生成式人工智能自主完成了创作,这一点在剖析“提示工程”中得以充分证明。生成式人工智能更像是满足人类需求的执行机器,而并非具有真正的创作能力。斯宾诺莎的“身心一元论”从哲学角度为这一点证成。因此,所谓自主创作仅仅只是幻象。人类因素在“人机交互”中,始终居于主导地位。这就解决了创作结果所体现的独创性来源何处的疑问。正是人类因素的主导和参与,完成了对创作结果的意向附加,AIGC“区别于现有创作”的独创性,则是在人类创作意向中诞生的。
因此,在考察AIGC是否具有独创性时,应当肯定“提示工程”在AIGC创作行为中的主导性。在AIGC满足“区别于现有创作”的独创性要求时,通过确认“提示工程”是人类意志的来源,以明确该独创性归属于人类意志,防止因“提示工程”的纯粹技术化解读,阻碍AIGC可版权性之路。这就需要:第一,明确“提示工程”是生成式人工智能创作的人为因素;第二,确认“提示工程”在创作中的主导作用;第三,明确生成式人工智能的自主性体现在深度理解人类指令,而非独立完成创作。
(三)树立开放性与差别性并存的AIGC保护立场
我国《著作权法》的基本宗旨体现出“使创作活动对作者与社会均有裨益”的价值追求。[27]P47通过激发创作积极性,来促进社会文化事业繁荣。《著作权法》的终极目标是社会知识总量的增加。在“作者主义”的视域下,法教义学虽然没有对鼓励的“创作活动”加以“自然人主体”的限定,但也并不意味着《著作权法》所鼓励的创作活动可以脱离自然人“具身”,而由机器对抽象思维的模仿来完成。但“鼓励创作活动”应当被理解为“鼓励自然人的创作活动”,并非“鼓励自然人亲力亲为的创作活动”。所以只要该创作活动的意向性来源于自然人“具身”的意志,则均符合《著作权法》鼓励的范畴。
因此,以下四点可以成为《著作权法》鼓励AIGC创作的依据:第一,“人机合作”是生成式人工智能创作的基本模式;第二,“人机合作”中自然人因素占据主导地位;第三,机器创作的意向性和目标性均来源于“提示工程”;第四,AIGC比拟于人类的独创性来源于自然人算法化的创作行为。因而“鼓励创作活动”即便细化为“鼓励自然人的创作活动”,也不应当因生成式人工智能的“工具性”介入,而被排除在鼓励对象的范畴之外。
近年来,我国《知识产权强国建设纲要(2021-2035年)》明确要求探索人工智能产出物的知识产权保护规则。《推动知识产权高质量发展年度工作指引(2022)》要求加快人工智能产出物知识产权保护制度的研究论证,以适应新领域、新业态发展的需要。《著作权法》的第三次修订也将“法律、行政法规规定的其他作品”修改为“符合作品特征的其他智力成果”,体现出对新兴作品类型的开放态度。《最高人民法院关于加强著作权和与著作权有关的权利保护的意见》提出,“依据著作权法准确界定作品类型,把握好作品的认定标准”。这些政策与法律极大反映出我国知识产权公共政策的开放、包容导向。在不与《著作权法》基本逻辑、理念冲突的前提下,将AIGC纳入版权保护,完全符合公共政策。
然而,AIGC的创作逻辑也注定了AIGC与传统著作权法定作品在创作行为上具有明显差异。以“春风送来了温柔”为例,这一AIGC作品的创作行为,由自然人的创作意向和算法化的创作方式两部分构成。创作意向是自然人以“具身”大脑对作品的预想与构思。创作方式则是提示词的选取与表达、参数的调整、引导微调等。虽然指令的发布来源于“具身”,但指令的执行却脱离了“具身”。AIGC的创作方式被分割为指令发布和指令执行两部分。由于指令执行是算法完成的,自然人的创作行为也从此环节开始,从常识意义上的直接转为间接。因此AIGC创作主体并没有实施传统意义上的勾勒、描摹、涂色、工笔等绘画创作方式,却在结果上完成一项绘画作品,形成“人人皆可成为画家”的常识悖论。
虽然不能以生成式人工智能在创作方式中的工具性替代来否认AIGC的自然人来源,但也不得不承认算法化的替代性工具和手工化的辅助性工具存在明显的差异,其承载的人格利益也不尽相同。传统绘画作品的创作意向与创作方式均来源于自然人“具身”,且无缝衔接。创作方式更是通过大脑指令与肢体执行的融合体现在绘画技艺中,承载更强的人格利益。而人工智能技术理念之一便是延伸自然人的能力范围,替代自然人的繁重劳动。AIGC的生成过程,可以充分体现这一点。劳动投入的减弱必然导致作品与主体之间关系黏性的衰退,也必然导致作品上承载的人格利益缩减。因此,虽然《著作权法》应当设置一般规则,对AIGC的保护持以开放包容态度,但也应当承认AIGC与传统法定作品类型的差异性,应当在法律上区分保护,避免“人人皆可成为画家”的常识性悖论。
“唯自然人创作主体论”逻辑自限的破除,为《著作权法》顺应知识产权公共政策价值导向,开通迭代变革的路径。《著作权法》应当顺应知识产权公共政策的开放、包容、解决实践需求的价值导向,积极为AIGC保护、交易与应用开展制度供给。这也是《著作权法》“回应新技术、新业态发展的需要”。
四、AIGC可版权性一般规则的内容构架
“作者主义”下AIGC可版权性逻辑困境的破解,以及逻辑起点的明晰,无不为AIGC可版权性一般规则的构建,提供了前提和理据。需要说明的是,个案中的AIGC具有可版权性,并不能推导出所有AIGC均有可版权性的结论。这需要根据AIGC可版权性认定的一般规则来进行具体认定。AIGC可版权性认定的一般规则,具有三个方面的优势:第一,可以有效避免具体AIGC作品通过维权的方式,行事后确权的目的,避免可能发生的滥诉;第二,为AIGC版权新业态提供明示的行为指引;第三,一旦AIGC的可版权性标准被规则化明确,司法确权的标准也将统一,有利于同等尺度的司法裁量。
基于AIGC与既有可版权性客体的同质性,在构建AIGC可版权性一般规则时,应将AIGC纳入《著作权法》既有的考量维度,即“独创性”标准、法定作品类型、不属于除外保护条件等。基于AIGC与既有可版权性客体同时存在的差异性,应当在以上几个维度中,围绕AIGC的载体、表现形式、创作手段等特殊性,对一般规则进行专门化构建。
(一)AIGC独创性的认定规则
在“生成式人工智能并非独立完成创作主体”的立场下,独创性考量应当围绕主体和客体而展开。AIGC属于自然人来源,已经在“自限性”论述中得到证成。然而,独创性标准中还存在“非抄袭”“体现创作思想”“区别于现有作品”等客观标准。需要同时满足,AIGC才具备法律上的独创性。只不过持客体论者认为,该因素如果在某个特定作品中具化体现,则足以认定构成作品;持主体论者认为,该因素即便在特定作品中具化体现,也因缺乏“自然人来源”,而不能认定构成作品。可见,对于AIGC可以“区别于现有作品”的问题,两种观点并不存在争议。在“自然人来源”主观标准抽象符合,以及“区别于现有创作”客观标准有能力符合的现实下,AIGC独创性考量,应当通过标准的规则化设定,来完成对司法实践的统一指引作用。
首先,在ChatGPT-4代表的生成式人工智能技术语境下,应当围绕“现有技术条件”来构建独创性主观标准规则。以ChatGPT-4为代表的生成式人工智能,是人类完成创作的工具,“人为干预因素”是生成“作品”主导创作的动力。因此,主观标准可以明确将生成式人工智能创作中的“人为干预因素”,作为判定创作“自然人来源”的依据。独创性主观标准的抽象满足,虽然已经在“人机关系”的功能分解中得到证明,但为了防止因技术迁移而带来的技术逻辑转变,需要将“现有技术条件”作为前置性考量规则。输出特定AIGC的生成式人工智能,如果是在迭代式需求交互主导的技术逻辑下完成的,则可以认定为符合“现有技术条件”,并根据主观标准抽象符合的立场,同时认定该AIGC属于“自然人来源”。如果特定AIGC所赖以生成的技术逻辑偏离了“现有技术条件”,则不能直接凭借“提示工程”来认定与独创性主观标准相符。
其次,以考量因素列举的方式设置AIGC的客观独创性考量规则。我国现有法律规则没有客观独创性标准,但从“创”的内涵中可以总结出“体现创作思想”“区别于现有作品”“非抄袭”等关键要素。AIGC客观独创性的个案考量,可以围绕以上因素展开。按照AIGC“创作来源-创作过程-创作结果”全链技术环节,分别设置考察因素。在创作来源上重点考察“体现创作思想”;在创作过程中重点考察“非抄袭”;在创作结果方面重点考察“区别于现有作品”。
由于AIGC可以具备“区别于现有作品”的能力,不存在理论争议,因而在个案判断时不应与传统作品存在规则上的差异。“体现创作思想”的判断可以借助“构思”为媒介。生成式人工智能在“现有技术条件下”应当认定为体现了人类作者思想。至于是否体现作者的“创作思想”,还需要与创作结果所反映出的创作水平挂钩。虽然国际上较为流行的标准,是标榜“最低创作劳动限度”的英美法“额头冒汗原则”,而我国却并未明确采纳。相反,“创”在知识产权法律语境中,通常代表着“一定的创新高度”。因此,即便是AIGC作品,也应当具有完整的创作构思。特别是在AIGC不可避免地需要对创作基础数据(包含他人作品)进行深度学习甚至加工的情况下,就更需要指令者能够系统性地描述AIGC所包含的创作构思,以及该构思“区别于现有创作”的独特之处。“区别于现有创作”的判定,可以覆盖“非抄袭”的因素认定。需要强调的是,不能仅仅凭借生成式人工智能对基础数据的挖掘与利用,就认定AIGC天然带有“抄袭”的色彩。而应当在个案中结合相似度比对,考察AIGC与原作品之间的关系。如果仅仅是对原作品的重新整合,原作品的构思在AIGC中清晰可见,则不符合“非抄袭”因素,反之,则视为因素相符。综合来说,独创性客观标准应当围绕考量因素列举的方式而设置,赋予法官一定的自由裁量权,便于应对AIGC形态万千的现实条件。
(二)AIGC专门作品类型的归属规则
由于我国《著作权法》对某些特定类型的作品,设置了专门的可版权性认定条件,例如美术作品需要考量审美价值。因而AIGC在符合独创性标准之后,还需要结合“作品类型”来判断其可版权性。对于AIGC的作品类型,目前有三种理论主张:第一种认为应当根据特定AIGC的外在表现形式和载体,将其归入传统的作品类型。第二种是将AIGC视为“法人作品”或“雇佣作品”。[28]P395-401这一主张因将“智能体”与“组织体”的概念混同而备受争议。“法人作品”或“雇佣作品”也并非用以描述作品类型,而是描述主体状态。因此,即便是“法人作品”或“雇佣作品”,也要归入传统的法定作品类型。第三种主张参照《计算机软件保护条例》的模式,在《著作权法》之下对AIGC进行专门立法,将AIGC视为一种特殊的“作品”类型加以保护。英国1988年修订的《版权、设计和专利法案》针对计算机生成作品制定的著作权特殊规则,[29]P670成为此类主张的实践依据。
AIGC无论以绘画、文字还是视频等任何模态出现,都改变不了其数字化载体的基本属性,其与传统作品类型在创作方式、人格利益等方面都有明显区别。例如,绘画作品的传统创作方式是勾勒线条、运用色彩和表达构思与情感。于是,运笔手法、线条流畅、色彩搭配以及体现出的神韵等诸多因素都会成为绘画作品审美评价的标准。绘画创作过程的描绘手法和意境,因创作者的专业技艺与风格而有所不同,具有较高水平的绘画者通常被称之为“画家”。而生成式人工智能输出的绘画作品却是以“迭代式需求交互”的方式,通过机器来完成。创作劳动的指令发布行为与绘画技艺所承载的人格利益有着明显的区别,因此,我们不能将AIGC绘画作品直接归入传统的“美术作品”。就如同通过发布指令来生成绘画作品的人类可以成为该AIGC的作者,但不能成为“画家”一样。因此,基于AIGC数字化载体的特征,应当依照作品类型法定的原则以及“符合作品特征其他智力成果”的兜底性条款,在立法中设置“AIGC作品”的专门类型。同时,基于“提示工程”独创性劳动在人格利益方面的限缩,AIGC即便以专门作品类型纳入版权保护,也应当在权利的内容、权利的存续期间等方面,与传统作品类型在规则上区别对待,至少应当弱于传统的法定作品类型。
(三)AIGC版权保护的除外规则
AIGC获得可版权性,还需要确认创作未落入《著作权法》保护例外的一般情形。AIGC的生成过程会实时根据指令需求,对开放域数据进行挖掘与利用。基于语料信息源的广泛性,AIGC可能会存在本身不适合可版权性的特殊条件,应当将这些风险性条件设定为AIGC的除外保护规则,成为AIGC可版权性判定的排除标准。
我国《生成式人工智能服务管理暂行办法》规定,生成式人工智能服务提供者,应当确保数据与模型来源、知识产权、个人信息等方面的合法性。同时,对于生成“作品”的内容生态,提出了“尊重社会公德和伦理道德”的规则性要求,例如符合社会主义核心价值观等。全国网络安全标准化技术委员会于2024年3月1日发布的《生成式人工智能服务安全基本要求》,也做出了更为详尽的合法性要求,例如语料来源可追溯、语料不良信息过滤、语料知识产权侵权识别、个人信息合法利用等。
可见,生成式人工智能“作品”要获得可版权性,还应当根据技术的合法性要求,制定专门的排除保护规则:第一,AIGC不存在内容生态问题;第二,语料训练和生成内容不存在知识产权瑕疵;第三,数据利用中个人信息的合法、合理使用。
此外,生成式人工智能根据实时输入语料进行模型调整,语料来源的准确性与真实性存在一定风险,可能会出现“幻觉现象”,即输出的AIGC外表看似连贯真实,而内容却系错误或捏造。2023年美国律师利用ChatGPT撰写的诉状即包含六个捏造的虚假案例。因此,生成内容的真实性、准确性与可靠性,应当是AIGC排除保护规则的又一考量因素。
(四)AIGC巧合生成的可版权性认定规则
生成式人工智能创作的基础在于预训练、优化训练数据。训练数据集往往包含大量复杂的原材料,可以基于学科类知识,回答专业性问题。特别是在训练数据的学习中,可以生成和分析复杂的源代码或机器代码,使生成结果具有一定的逻辑性,并在改述原材料的过程中,保持一定的风格、语气、情感和意图。这些也都源于开放域对语料库的赋能。
以ChatGPT-4为代表的生成式人工智能,在对人类反馈的强化学习中,不断推动语料库的预训练数据转向优化训练数据,以此习得并表达人类主观倾向。虽然AIGC归属于人类创作劳动毋庸置疑,但机器在检索训练数据的过程中,对人类创作经验积累的个体差异性难以如法炮制。这是人机之间无法逾越的障碍。因此,生成式人工智能由于数据基础和创作技术逻辑的趋同性,巧合生成相似作品的机率远远高于传统非能动性工具的创作模式。亦即,在非抄袭的情况下,相似甚至高度相似的巧合生成作品,可能会层出不穷。这也是一般规则构建中不得不考虑的问题。例如,在不知情也不应当知情的情况下,两个甚至多个巧合生成作品是否都应当赋予可版权性?答案必然是否定的。AIGC作品虽然归属于特殊的作品类型,但知识产权权利属性中自带的垄断性与排他性,不允许相同或相似创作的平等授权。因此,巧合生成作品应当奉行知识产权法一贯的“在先保护”原则,在后的巧合生成作品不能具备可版权性。但是,在后巧合生成作品的创作和使用,也不应当径直划入侵权的范畴。
对于在后巧合生成作品的侵权否定,可能会造成在AIGC作品真正侵权关系中的举证困难。巧合生成势必成为侵权人抗辩的“利器”。因此,要求AIGC作品标识化以及语料来源可追溯,必将成为AIGC可版权性一般规则的关联制度。在这一点上,《生成式人工智能服务安全基本要求》已显示出“语料来源可追溯”的明确立法趋势,这可以为AIGC可版权性一般规则的适用提供助力。
总结