目录
引言
01 资质合规
02 内部合规管理体系及制度
03 互联网应用关键条款完善
04 外部商业合作
结语
引言
从GPT 3.5的问世、GPT4.0的革新到Google最近推出的Gemini系列原生多模态AI基础模型,生成式人工智能(AIGC)在全球范围内的奇点时刻似乎愈来愈近。在中国, AIGC的应用也已经深入到金融、医疗、交通等多个关键行业。然而,随着AIGC技术的广泛应用,其法律和伦理问题也日益凸显。为了规范这一新兴领域,我国出台了若干相关法律和规定,其中的针对性法规包括《互联网信息服务算法推荐管理规定》[1](“《算法推荐规定》”)、《互联网信息服务深度合成管理规定》[2]和《生成式人工智能服务管理暂行办法》[3](“《AIGC暂行办法》”)。这些规定不仅为AIGC的应用提供了法律框架,也为行业的合规操作提出了具体要求。
对于生成式人工智能平台(“AIGC平台”)而言,合规运营不仅保护平台自身的权益,也有助于维护消费者的权益,同时促进技术的健康发展。本文将从资质合规、内部合规管理体系及制度、互联网应用关键条款完善、外部商业合作等方面初步绘制AIGC平台合规管理的全景图像,为AIGC服务提供者(指《AIGC暂行办法》中规定的,利用生成式人工智能技术提供生成式人工智能服务的组织、个人,“AIGC服务提供者”)在探索快速发展的AIGC领域提供合规操作指南。
01 资质合规
AIGC服务提供者作为互联网信息服务提供者,应当根据《互联网信息服务管理办法》[4]和《中华人民共和国电信条例》[5],申请办理B25类信息服务业务的增值电信业务经营许可证(“ICP证”);在一些服务领域或业务场景内,AIGC平台还需取得专门的许可证。同时,如AIGC服务提供者提供的服务具有舆论属性或者社会动员能力,AIGC服务提供者在向公众提供服务前,应当进行安全评估,并按照《算法推荐管理规定》履行算法备案手续。具体而言:
1. 互联网信息服务业务经营许可证/备案(ICP证/备案)
根据《互联网信息服务管理办法》,互联网信息服务可分为经营性和非经营性两类。经营性互联网信息服务,是指通过互联网向上网用户有偿提供信息或者网页制作等服务活动。非经营性互联网信息服务是指通过互联网向上网用户无偿提供具有公开性、共享性信息的服务活动。国家对经营性互联网信息服务实行许可制度;对非经营性互联网信息服务实行备案制度。未取得许可或者未履行备案手续的,不得从事互联网信息服务。因此,针对需提供经营性互联网信息服务的AIGC平台,需取得B25类增值电信业务经营许可证(即ICP证);若为提供无偿服务的AIGC平台,需申请ICP备案。
特别需要注意的是,根据《工业和信息化部关于开展移动互联网应用程序备案工作的通知》[6],APP主办者提供互联网信息服务的,应当向省级通信管理局履行备案手续,未履行备案手续的,不得从事APP互联网信息服务。因此,对于需要提供App、小程序等移动互联网信息服务的AIGC平台,应当注意及时向省级通信管理局履行备案手续。
2. 在线数据处理与交易处理业务许可证(EDI证)
根据《中华人民共和国电信条例》,经营增值电信业务需要根据业务覆盖范围是否跨省、自治区、直辖市分别向国务院信息产业主管部门或省、自治区、直辖市电信管理机构申请办理《跨地区增值电信业务经营许可证》或《增值电信业务经营许可证》。在线数据处理与交易处理为增值电信业务的一种,从事该业务需要取得在线数据处理与交易处理业务证(即EDI证)。因此,对于需要从事数据处理与交易处理的AIGC平台,需取得EDI许可证。
3. 公安联网备案
根据《计算机信息网络国际联网安全保护管理办法》[7]等相关规定,互联单位、接入单位和使用计算机信息网络国际联网的法人或其他组织,都应当自网络正式联通之日起30日内,向所在地的省、自治区、直辖市人民政府公安机关指定的受理机关办理备案手续,实践中各网站通常登录“全国公安机关互联网站安全管理服务平台”提交公安联网备案申请。对于AIGC平台而言,通常需要通过互联网向用户提供信息服务,因此应当及时进行备案。
4. 算法备案
根据《算法推荐管理规定》、《深度合成管理规定》《AIGC暂行办法》规定,具有舆论属性或者社会动员能力的AIGC服务提供者必须就AIGC所使用的算法进行算法备案。目前我国法律法规和相关规定中仅明确了“具有舆论属性或社会动员能力的互联网信息服务”(即开办论坛、博客、微博客、聊天室、通讯群组、公众账号、短视频、网络直播、信息分享、小程序等信息服务或者附设相应功能以及开办提供公众舆论表达渠道或者具有发动社会公众从事特定活动能力的其他互联网信息服务),而对于何为具有舆论属性或社会动员能力的算法推荐服务、深度合成服务、生成式人工智能服务则暂时并未给出进一步定义。实务中,对于何为“具有舆论属性或社会动员能力”的判断相对较为宽泛,几乎涵盖了所有具备信息共享功能的服务。因此,除少部分功能简单,并且完全不具备任何信息互通以及用户交流能力的平台以外,其余大部分具备一定信息传递以及用户聚合能力的AIGC平台均需由AIGC服务提供者进行算法备案。
在算法备案所需提交材料中,尤以《算法安全自评估报告》最为复杂。该报告要求AIGC服务提供者提供包括算法风险研判、算法风险防控情况的描述,并要求AIGC服务提供者完成包括风险防范机制、用户权益保护体系、内容生态治理体系、模型安全保障机制、数据安全防护体系在内的风险管理制度建设。
5. 安全评估
目前我国多部法律法规和相关规定中均对“具有舆论属性或社会动员能力的互联网信息服务”提出了安全评估的要求。如上文所述,AIGC平台服务很有可能涉及具有舆论属性或社会动员能力的互联网信息服务,即需要按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》通过全国互联网安全管理服务平台完成安全评估。按照《AIGC暂行办法》等法律法规和相关规定,对于AIGC平台服务还需进行新技术新应用安全评估(“双新评估”),而关于双新评估的具体流程以及要求仍有待监管部门进一步公开。
6. 《计算机软件著作权登记证书》、《App电子版权证书》或《软件著作权证证书》
根据安卓、苹果等应用市场的APP上架规则[8],服务提供者通常被要求提交《计算机软件著作权登记证书》、《App电子版权证书》、《软件著作权认证证书》之一作为著作权归属证明供运营商审核。其中,《计算机软件著作权登记证书》由中国版权保护中心登记颁发、《App电子版权证书》由易版权平台认证颁发、《软件著作权认证证书》由中国版权协会认证颁发。因此,如需在App应用上架,建议及时向相应的机构或平台申请著作权归属登记认证。
7. 其他业务所需资质
通常AIGC平台业务场景较为广泛,很有可能涉及多个行业的监管,从而需要获得特定行业的相关证照才能够合法运营,例如,在涉及图文、视听节目的情形下,往往还涉及《网络文化经营许可证》、《网络出版服务许可证》、《信息网络传播视听节目许可证》等行业监管角度的证照。届时应当根据AIGC平台具体的业务模式综合判断其是否需办理相关资质证照。
02 内部合规管理体系及制度
1. 科技伦理审查制度
2019年7月,中央全面深化改革委员会第9次会议审议通过《国家科技伦理委员会组建方案》。2019年10月,中共中央办公厅、国务院办公厅印发通知,成立国家科技伦理委员会,并先后成立了人工智能、生命科学、医学三个分委员会。2023年12月1日,科学技术部、教育部、工业和信息化部等多部门联合发布的《科技伦理审查办法(试行)》[9](“《科技伦理审查办法》”)正式实施,该办法明确从事生命科学、医学、人工智能等科技活动的单位,研究内容涉及科技伦理敏感领域的,应设立科技伦理(审查)委员会。即,AIGC服务提供者涉及开展《科技伦理审查办法》适用范围内的科技活动,需自行设立科技伦理(审查)委员会或委托其他单位的科技伦理(审查)委员会对于所涉科技活动进行科技伦理审查。
2. AI内容安全基础审查制度
2023年10月11日,全国信息安全标准化技术委员会发布《生成式人工智能服务安全基本要求》(征求意见稿)[10],为面向境内公众提供生成式人工智能服务的提供者提高服务安全水平、提供者自行或委托第三方开展安全评估或相关主管部门评判生成式人工智能服务的安全水平提供参考。该文件对于语料安全、模型安全、安全措施、安全评估等提出统一要求。就AIGC的整体内容安全而言,AIGC服务提供者应当履行下述基础义务:
(1)AIGC平台的语料安全合规义务
1)
语料来源安全审查:对语料来源进行管理,建立语料来源黑名单,对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5%的,将该来源加入黑名单;
2)
语料内容安全审查:对训练语料内容应进行过滤,采取关键词、分类模型、人工抽检等方式,充分过滤全部语料中违法不良信息;对训练前语料的知识产权侵权情况应进行识别,建立知识产权管理策略,设置语料以及生成内容的知识产权负责人;对包含个人信息的语料,应在充分满足合法使用该个人信息的条件后进行使用;
3)
语料标注安全审查:对标注人员,应自行进行考核、职能划分,以及预留充足、合理的标注时间;对标注规则,应至少包括标注方法、质量指标等内容,并对功能性标注和安全性标注分别制定标注规则;对标注内容准确性,应对功能性标注和安全性标注设立不同审核通过标准。
(2)针对AIGC平台的模型安全要求包括:
1)
模型备案要求:AIGC服务提供者如使用第三方基础模型进行研发,则应当确保该等基础模型已经经过或至少正在申请主管部门备案[11],而不建议使用未经主管部门备案的基础模型;
2)
模型生成内容安全要求:在AI的训练过程中,AIGC服务提供者应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一;每次对话中,应对使用者输入信息进行安全性检测,引导模型生成积极正向内容。
(3)针对AIGC平台的安全措施要求包括:
模型适用安全措施要求:AIGC服务提供者根据服务领域,应充分论证应用必要性、适用性以及安全性;根据服务场合,应具备与风险程度以及场景相适应的保护措施;根据服务人群,应采取不同技术或管理措施。
3. 数据安全制度
结合《AIGC暂行办法》、《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律法规,我们梳理了数据输入、模型开发、部署使用以及运营监控四个周期内AIGC服务提供者所需履行的数据安全合规义务,AIGC服务提供者应当依据其提供的服务内容及类型制定有效的数据安全制度。具体而言,
(1)
数据输入周期。在该周期内,AIGC服务提供者将完成训练数据的采集和预处理(包括数据标注、数据清洗等),并最终形成完整的预训练语料库与数据集。该周期内,AIGC服务提供者所需要遵守的合规义务包括:
a.
数据采集合规义务,即使用具有合法来源的数据和基础模型,至少需要涵盖知识产权、个人信息保护、反不正当竞争法等相关的方面。
通常而言,数据来源的类型主要包括自行采集型、数据交易型和开放数据爬取型,其中,自行采集是指通过APP、传感器等方式直接采集数据,数据交易是指通过合法的交易方式从数据提供方处获取相关数据,开放数据爬取则是指通过数据爬虫等方式从第三方获取开放的数据。
根据数据来源的类型不同,确保数据来源合法性的常规操作亦有所不同。在自行采集型与数据交易型中,AIGC服务提供者并非数据的原始采集人,无法直接了解该等数据的原始采集过程,因此其保证数据来源合法性的重点在于(i)确保取得相关数据权利主体的授权,建立数据许可规范;(ii)在有关数据供应协议或软件许可协议中要求供应商/许可方对其提供的数据/模型不侵犯第三方权利做出陈述与保证 (具体详见下文第四部分:外部商业合作);以及(iii)在对外宣传或用户协议中注明其所使用的数据或基础模型的来源方,并进行免责声明。而当AIGC服务提供者以开放数据爬取的方式收集数据时,则应当重点关注数据爬虫行为本身是否满足上述合法性要求,例如不得违反Robots协议和网站公开的声明/协议等文件、不得干扰网站的正常运行等。
总体而言,建议AIGC服务提供者针对数据采集确立一套合规流程及风险评估标准,以确保数据收集的合法合规性。
b.
数据处理合规义务,即依法进行数据清洗、数据标注等数据处理活动,主要内容包括:
i.
涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;
ii.
采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性,包括但不限于制定并执行数据筛选规范、数据清洗规范等数据质量优化工具;针对数据标注,制定可操作的标注规则,包括但不限于前文所述语料标注规则。
(2)
模型开发周期。该周期为AI模型的核心周期。在该周期内,AIGC服务提供者将完成AI模型的训练,基于AI模型拟完成的任务对AI模型进行微调,确保模型能够灵活应对不同任务需求,提高模型的泛化性与迁移性。该阶段AIGC服务提供者将对AI模型进行一系列技术验证测试及安全测试,并最终形成可部署AI模型。该周期内,AIGC服务提供者所需要遵守的合规义务至少包括:
a.
算法安全及伦理合规义务。包括但不限于:
i.
建立算法机制机理审核制度,定期审核、评估、验证算法机制机理、模型、数据和应用结果,禁止研发并及时制止诱导用户沉迷、过度消费等违反法律法规或者违背伦理道德的算法模型;
ii.
建立算法反歧视制度,在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,防止因为AI模型的算法偏见而导致产生民族、信仰、国别、地域、性别、年龄、职业、健康等算法歧视现象;
iii.
建立算法安全制度,包括(i)算法鲁棒性监测制度,通过红队测试,定期模拟对抗样本攻击、数据污染等,监测、评估、验证并优化算法鲁棒性;(ii)算法透明度监测制度;(iii)算法信息过滤监测制度,在程序、算法方面设置过滤、发现或抵制机制;(iv)模型可控性监测制度;(v)算法安全事件应急处理相关规则等。
b.
网络安全义务。包括但不限于:
i.
按照网络安全等级保护制度,开展网络安全认证、检测、风险评估、风险管理等活动,制定网络安全事件应急预案,及时处置系统漏洞、计算机病毒、网络攻击、网络侵入等安全风险;
ii.
开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全;
iii.
明确数据安全负责人和管理机构,落实数据安全保护责任。
(3)
部署使用周期。在该周期内,AIGC服务提供者将完成AI模型及下游应用系统的定型、系统部署与运行测试,跑通在线服务,并最终形成以AI模型为基础,面向最终用户端提供完整操作体验的可商用化AI系统。该周期内,AIGC服务提供者所需要遵守的合规义务主要包括:
a.
建立AIGC公平竞争机制,杜绝利用算法共谋方式形成垄断、排除市场竞争,遵循反垄断、反不正当竞争相关法律规定;
b.
建立AIGC透明度支持团队,在主管部门依对AIGC的服务开展监督检查时予以配合,并按照主管部门的要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。
(4)
运营监控周期。该周期是AIGC服务提供者将成熟的AI系统进行商业化落地的周期。在该周期内,AI模型将正式投入市场使用。AIGC服务提供者须实时监控用户及市场反馈,及时处理各类应急情况并与有关政府部门合作。在发生危害网络安全的事件时,AIGC服务提供者须立即启动应急预案,采取相应的补救措施,并按照规定向有关主管部门报告。同时,应当对数据处理活动定期开展风险评估,并向有关主管部门报送风险评估报告,以维护AI系统的稳定性。
4. 内容生态治理制度
根据《网络信息内容生态治理规定》[12]、《算法推荐管理规定》、《深度合成管理规定》等规定的要求,建议AIGC平台应当以下列合规要点为抓手,建立并完善平台内容生态治理制度体系:
(1)
制定网络信息内容生态治理细则,健全用户注册、账号管理、信息发布审核、跟帖评论审核、版面页面生态管理、实时巡查、应急处置等制度,同时设立网络信息内容生态治理负责人,配备与业务范围和服务规模相适应的专业人员;
(2)
建立内容知识产权侵权内容处置流程,并在平台规则中设置“通知-删除”相关条款,及时屏蔽、下架相关侵权内容链接,并对侵权用户采取封禁等措施;
(3)
如采用个性化算法推荐技术推送信息的,应设置符合规定的推荐模型,建立健全人工干预和用户自主选择机制;
(4)
编制网络信息内容生态治理工作年度报告,年度报告应当包括网络信息内容生态治理工作情况、网络信息内容生态治理负责人履职情况、社会评价情况等内容;
(5)
加强深度合成内容管理,采取技术或者人工方式对深度合成服务使用者的输入数据和合成结果进行审核;
(6)
建立辟谣机制,投诉、举报机制以及舆情监控机制,并配备相应的外部操作入口以及内部标准处理流程,及时受理并处理用户的投诉、举报以及所发现的平台相关舆情,保存有关记录,并向有关主管部门报告,对相关使用者依法依约采取警示、限制功能、暂停服务、关闭账号等处置措施;
(7)
建立健全用于识别违法和不良信息的特征库,完善入库标准、规则和程序,记录并留存相关网络日志;
(8)
提供模拟自然人进行文本的生成或者编辑服务、语音生成或者显著改变个人身份特征的编辑服务、人物图像、视频生成或者显著改变个人身份特征的编辑服务等具有生成或者显著改变信息内容功能的服务时,可能导致公众混淆或者误认的,应当在生成或者编辑的信息内容的合理位置进行显著标识,向公众提示深度合成情况。
5. 用户权益保护制度
根据《互联网用户账号信息管理规定》[13]、《个人信息保护法》、《网络信息内容生态治理规定》、《算法推荐管理规定》等法律法规的要求,为确保AIGC平台的用户权益,AIGC服务提供者应当采取的合规管控措施至少包括:
(1)
建立用户实名认证制度;
(2)
建立用户个人信息保护制度;
(3)
明确用户权利义务;
(4)
保证用户知情权;
(5)
保证用户选择权;
(6)
明确用户投诉处理路径;
(7)
指导用户认识AIGC技术,并防范未成年沉迷及过度依赖。
03 互联网应用关键条款完善
由于AIGC在内容生成物属性方面的不确定性以及对于数据安全的潜在影响力,建议AIGC平台在用户协议条款中加入了不同于传统互联网应用的安排,以便最大程度防范潜在的版权纠纷以及数据风险。
(1)
输入内容的权利安排。在AIGC服务中,用户输入的内容通常包含一定的知识产权。根据《中华人民共和国著作权法》[14]及其实施细则,由用户创造的、用户输入内容的原始权利应当归用户所有,但同时用户亦需要为其所输入的内容承担相应的责任,例如保证不侵犯第三方权利,保证不得含有违反法律法规或公序良俗的信息。
(2)
输入内容的使用限制。由于用户输入内容的权利属于用户,而AIGC服务提供者往往需要使用输入内容进行模型优化,因此,AIGC服务提供者需要就原始输入内容的后续使用获得用户的明确授权。AIGC服务提供者可以在用户协议中明确规定,服务提供者使用用户输入内容的范围和目的。
(3)
生成内容的权利安排。生成内容的权利安排相较于用户输入内容则更为复杂,目前,行业内采取的权利安排主要分为用户独占,或用户所有+平台无偿使用两种类型。我们理解,赋予用户对生成内容的权利有助于AIGC行业吸引更多用户,同时允许AIGC服务提供者在一定范围内使用这些内容,例如用于展示、宣传或模型优化,则可以同时满足AIGC平台的模型自我学习与进化的需求。
(4)
生成内容的使用限制。AIGC服务提供者作为生成内容的主要责任人之一,有责任确保其服务不被用于非法目的,因此需要在用户协议以及平台准则中限制生成内容的使用,以避免用户将生成内容用于从事违法活动或侵犯他人权利的行为之中。
04 外部商业合作
除了上文所提及的资质证照、内部管理体系及制度以及互联网应用所必须的外显文件外,AIGC平台在对外合作过程中还会与诸多合作方签署不同的商业合作协议。该等商业合作协议根据AIGC平台自身的性质与合作事项的不同包括诸多类型。AIGC平台需要根据不同的协议类型以及自身的商业安排与合作方就各自的权利义务达成一致。以下,我们主要就相关协议中AIGC平台需要关注的重点内容进行简要提示。
1. 与技术支持方签署的AI模型开发/许可协议
倘若AIGC平台作为平台运营方,在与技术支持方签署的AI模型开发或许可协议中,AI模型本身的知识产权权属问题通常是双方的关注要点之一。AI模型作为计算机软件,其核心技术成果包括代码及经训练后获得的参数。其中,AI模型代码可以作为计算机软件作品获得版权保护,AI模型代码对应的算法在符合商业秘密构成要件的情况下也可以作为商业秘密获得保护,因此,与传统软件开发/许可协议相同,协议双方通常会针对合作过程中所产生的上述相关权属安排进行提前约定。
而AI模型参数是用于定义模型的可调整变量,主要基于大量输入训练数据集、调整模型的原始参数值从而输出最佳结果。因此,AI模型参数的取得与训练数据的数量和质量紧密相关,这也导致协议双方在约定AI模型参数的知识产权权属时可能会产生一定的争议,我们建议在合作前期即对相关权属进行提前约定。
2. 与数据提供方签署的数据交易/数据训练协议
通常情况下,技术支持方在开发AI模型的过程中将会使用到大量的训练数据,该等训练数据可能由AIGC平台自行采集、开放数据爬取或通过数据交易的方式从其他数据提供方处取得。对于通过数据交易方式取得的数据,一方面,AIGC平台应当确保数据提供方提供的数据具有合法来源,在数据交易协议中要求数据提供方对相关数据的收集和对外提供等处理行为进行陈述保证,例如遵守相关法律法规、不侵犯第三方的合法权益等,并约定相应的法律责任。另一方面,考虑到高质量的训练数据对模型的优化至关重要,因此AIGC平台还应当在数据交易协议中明确数据的采购要求及验收标准。
此外,数据的使用方式以及相关权益的归属也是协议双方应当关注的要点之一。就数据的使用方式而言,技术支持方通常需要对数据提供方提供的数据进行提取、清洗、筛选等衍生处理以用于模型训练或其他商业用途,为了避免后续产生纠纷,双方应当在协议中就如何使用数据进行明确约定。就数据相关权益的归属而言,数据虽然在权利属性方面尚存争议,但从实践来看,双方仍可以就数据相关权益的归属、后续利用范围和限制等予以明确约定。特别地,对于经过AIGC平台衍生处理后的数据形成的相关权益,AIGC平台亦可以在协议中予以主张。
结语
在探索AIGC这片广袤而充满潜力的新海洋时,合规便是企业航船的罗盘。合规经营不仅是企业遵循法律的基本要求,更是其长远发展和市场竞争力的关键所在。
其实,合规不仅是对现有规定的被动遵循,它更应是一种主动的战略布局,需要企业不断更新对法律环境的认知,主动预测和应对法规的变化,构建与时俱进的合规机制,制定前瞻性的合规计划,从而为自身赢得战略优势。在AIGC领域,合规更要求研究机构、上下游企业以及法律合规团队等参与主体不断地更新知识体系、积极参与行业对话,方能行稳致远。