实盘配资是指投资者通过向配资公司借入资金,用借入的资金购买股票进行投资。配资公司会根据投资者的信用状况和投资标的,提供不同倍数的配资杠杆。例如,1:1的配资杠杆意味着投资者可以借入与自己资金等额的资金进行投资。
实盘配资炒股是指投资者通过向配资公司借入资金,以放大自己的投资本金进行股票交易。配资公司通常会提供2-10倍的杠杆,这意味着投资者可以借入2-10倍于自己本金的资金进行交易。
【摘要】随着生成式人工智能的快速发展,人工智能生成内容在著作权法框架下的适应性问题引发了广泛讨论。生成式人工智能作为新兴的创作工具,技术发展使得人参与创作的贡献度下降了,但生成的内容仍然属于人利用工具进行智力创造的范畴,满足独创性和可复制性要件后,可以纳入著作权法的保护。人工智能本身、人工智能系统的开发者、训练数据的提供者不宜取得人工智能生成内容的著作权,生成内容的著作权归属于人工智能的使用者,符合著作权法激励创新的制度目的。人工智能开发者和服务提供方在数据训练、数据输出等阶段往往面临著作权合法性困境,以及侵权风险,目前难以通过事前授权或合理使用规则化解。多样化的训练数据一定程度上增加了企业著作权合规风险。基于此,著作权法律制度需要在既有规则基础上进行探索与突破性适用,将作品署名与其他著作权行为进行分离解释,为作品合理使用和传播提供法律基础。优化与更新当前的数据授权模式,促进不同主体之间的数据共享和交换,在保护数据创作者权益的同时,兼顾生成式人工智能开发者、使用者的合理需求,降低训练数据的侵权风险。
【关键词】人工智能 著作权 创作工具 数据训练
一、引言
在当今信息化时代,迅猛发展的人工智能技术已成为推动社会进步与经济增长的关键动力。特别是以ChatGPT、Sora为代表的生成式人工智能技术,通过自主的学习能力模仿人类思维,能够生成具有一定独创性的作品,例如人工智能写作、绘图和作曲程序已经能够生成在外观上与人类作品难以区分的内容。这些技术不仅在文本创作、图像设计、音乐制作等领域展现出惊人的潜力,在教育、医疗、法律等专业服务领域也开始崭露头角,极大地丰富了人类的知识库和社会生活。
然而,技术的每一次飞跃都伴随着对现有法律制度的挑战。生成式人工智能技术的发展,尤其是在创作领域的应用,引发了著作权法律领域的一系列问题。这些问题不仅涉及人工智能生成内容的作品属性认定和作者身份与权利归属,还包括生成式人工智能数据训练的著作权合法性困境。以人工智能生成内容的作品属性认定为例,以往的研究认为,人工智能生成内容缺乏人类创作所必需的独创性,这些内容更多是对算法、规则和模板的机械应用。然而,随着人工智能技术的迭代升级,其所展现出的对话理解、逻辑推理和文本生成能力,使得文本内容在形式上更加接近人类的创作成果。生成式人工智能大模型算法的复杂性,以及对大数据的深度分析和处理的能力等,使得生成式人工智能能够生成具有一定“个性化”的内容,而这种“个性化”无疑增加了将人工智能生成内容视为作品的合理性。
因此,随着生成式人工智能技术的不断进步和应用领域的拓展,如何构建一个既能保护人类创作者权益,又能适应新技术发展的著作权法律体系,成为亟待解决的问题。本文旨在探讨生成式人工智能作为创作工具的适应性问题,从法律、技术、伦理等多个角度进行深入探讨,阐明生成式人工智能数据训练的著作权合法性困境,最终确定著作权法律制度的优化方向。在这一过程中,不仅要考虑技术的发展趋势,还要关注法律的价值取向和社会的公共利益,以期为人工智能时代的著作权保护提供合理的制度设计。
二、生成式人工智能作为创作工具的适应性分析
生成式人工智能作为新兴的创作工具,在著作权法框架下的适应性分析主要涉及两个核心问题:人工智能生成内容的作品属性认定以及作者身份与权利归属。这些问题的探讨不仅关系到人工智能技术的发展前景,也直接影响到传统著作权制度的适用边界和产业未来发展的方向。
(一)人工智能生成内容的作品属性认定
传统著作权法强调作品是“人”的智力成果,只有自然人才能进行创作活动,人工智能生成内容是由算法进行判断和选择的,并非人的创作成果,不应受到著作权法的激励。相反观点则认为,从思想表达的外观上很难区分人工智能生成内容和人类作品,不应将创作者身份作为作品受保护的决定性因素。实际上,人工智能生成内容并不是算法自主选择的结果,而是人类与机器算法相结合的产物。生成过程依赖于人类的输入和设计,数据的供给和训练,需要人类设定、调整参数,下达任务指令,并进行后期的筛选和编辑。以人工智能生成图片为例,与人类使用照相机拍摄照片的区别在于使用工具的不同,人能够利用人工智能模型生成图片,这是技术发展进步的结果,人类将更多的创造投入在工具的开发上,相比之下,在照片生成阶段的参与贡献度下降,但仍然属于人利用工具进行智力创造的范畴。
根据现行著作权法,判断人工智能生成内容是否构成作品,须满足两个基本要件:一是独创性,二是“能以一定形式表现”,即可复制性。由于人工智能生成的内容通常以数字形式存在,较易满足可复制性要件,因此当前理论界和司法实践大多围绕独创性要件展开讨论。根据最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》第15条的规定,独创性是指“作品的表达系独立完成并且有创作性”。具体到人工智能生成内容的作品属性认定问题,需要从以下两个方面展开讨论:一是人工智能生成内容能否认定为“独立创作”;二是人工智能生成内容是否符合“独创性”要件,属于智力创作的产物。
关于人工智能生成内容是否构成“独立创作”问题,“独创性”中的“独”强调的是劳动成果源于劳动者本人,可以是从无到有创造出来,也可以是以已有作品为基础进行再创作,只要与原作品之间存在可被客观识别的差异,实质上是作为一种比较性标准,强调的是作品表达的独立性和非抄袭性。在人工智能生成内容的情境下,机器的“创作”过程通常涉及对大量数据的分析和学习,进而生成新的内容。这种过程虽然不同于人类的创作方式,但如果机器在生成内容时未直接复制或简单改编已有作品,而是基于学习到的知识和规则产生了具有新颖性的表达,即机器在创作过程中展现了一定程度的自主性,只要最终生成的内容不是对已有作品的简单复制或模仿,就可以视为独立创作。
关于人工智能生成内容是否满足“创造性”要求问题,“独创性”中的“创”要求能够体现作者独特的智力判断与选择。一方面,著作权法中的“创造性”无需达到专利法的高度,只需达到一定创作高度即可。当前,如儿童随手涂鸦的画作、随手取景的照片等人类创作物大多能被认定构成作品,人工智能生成内容的作品属性认定应与人类创作物保持同一认定尺度,人工智能生成内容是人类对提示词反复选择和安排,以及调整参数的结果,举轻以明重,其也应被认定为满足“创造性”的要求。另一方面,提示词和参数的使用体现了人类意志因素,也是人工智能生成内容受著作权法保护的正当性基础,人类意志的确定性程度,与提示词和参数使用的数量成正比。再以人工智能生成图片为例,对于传统的美术作品而言,描绘同一物品,不同的绘画师选取的角度、线条、颜色搭配和画面布局不同,最终形成的作品体现了个人智力判断和选择。在人工智能生成内容的场景下,人类将个人的意志以提示词的方式表现,通过输入文字指令,同样输出具有个性化选择的图片。相比于传统的绘画作品,人工智能生成图片只是改变了输入方式,利用了更高效的工具,本质上仍然是人类主体的创作行为。
需强调的是,并非所有人工智能生成内容都可以纳入著作权法的保护,只有当生成内容满足独创性和可复制性两大要件,进行了最低限度的创造性选择或安排,达到独创性要求后,才能认定为作品。
(二)人工智能生成内容的作者身份与权利归属
在人工智能生成内容场景下,创作过程往往涉及多个主体,包括人工智能系统的开发者、训练数据的提供者、人工智能的使用者以及人工智能本身。这种复杂的创作链条使得确定作者身份和权利归属变得困难。
第一,人工智能本身无法享有生成内容的著作权。《中华人民共和国著作权法》第11条不仅规定了创作作品的自然人是作者,还承认法人或非法人组织可以视为作者。第12条规定了以署名推定作者身份,且还推定该作者对署名的作品享有著作权。可见,人工智能无法取得我国著作权法意义上的作者身份,进而无法以署名推定著作权归属,需要重新考虑作者身份的认定。基于人工智能生成内容的特殊性,可以考虑采用将署名与其他著作权分离的制度设计。我国在2021年和2022年相继出台了《互联网信息服务算法推荐管理规定》和《互联网信息服务深度合成管理规定》,对人工智能生成内容的标识义务作出规定,目的是维护公众知悉创作者真实身份的权利,提升信息透明度,维护公众信任。但该署名要求与著作权法上的署名行为存在本质不同,法律规定人工智能生成内容的标识义务,主要是为了向公众标明内容的生成方式和出处,而非彰显作者个人身份,更多是出于提供信息、避免混淆的考虑。因此,不能从标识义务倒推生成内容的权利归属,这一义务规定也不意味着赋予了人工智能主体地位。
第二,人工智能系统的开发者、训练数据的提供者不宜取得人工智能生成内容的著作权。首先,著作权保护的本质是保护人类的创造性表达。而系统的开发者和训练数据提供者的贡献更多是技术层面的支持,他们并未直接参与具体内容的创作过程,也缺乏针对特定生成内容的创作意图。其次,如果将著作权归属于系统的开发者和训练数据的提供者,同一套算法可以生成无数的内容,同一批数据可以训练出不同的模型,难以界定每个开发者或数据提供者对最终生成内容的贡献和权利范围,会加剧权利归属的认定难度。最后,从激励创新的角度来说,人工智能系统训练数据通常来自各种来源,包括公开数据、个人数据、个人权利作品等,如果开发者和数据提供者能够获得生成内容的著作权,相当于仅通过技术手段,而非创造,获得了著作权,著作权市场上可能会失去创作动力,削弱人类创作的积极性,背离著作权保护的目的。
第三,人工智能生成内容的著作权应归属于生成式人工智能的使用者。首先,在人工智能生成内容的过程中,使用者通过输入指令、选择参数等方式实际控制着人工智能的创作过程,并对最终生成的内容具有直接的贡献。其次,将著作权归属于使用者可以简化权利归属的复杂性,减少因多主体参与而导致的权利纠纷。此外,这也有助于建立更为清晰和高效的许可机制,促进人工智能生成内容的合法传播和利用。最后,从著作权法激励创新角度看,输入不同的提示词和参数,人工智能会输出不同的内容,且人们可以根据设想不断调整提示词,生成不同的表达。如果著作权归属于使用者,将激励更多的人使用人工智能工具进行创作,借助技术完善表达,促进技术与艺术的结合,推动文化产业的革新和发展。这将激励人们在使用人工智能时投入更多的创造性劳动,以获得著作权法的保护。
三、生成式人工智能数据训练的著作权合法性困境
生成式人工智能技术的迅猛发展打破了以自然人为中心的内容创作格局,在提升创作效率的同时也为著作权法带来了前所未有的挑战。其中,围绕人工智能数据训练所产生的著作权侵权风险已经成为相关企业沉重的合规负担,为产业的健康发展带来了不确定性。然而,我国著作权法及配套监管规则未能有效回应新兴智能科技的发展需求。一方面,现行的《中华人民共和国著作权法》并未针对数据训练设置专门的免责条款,致使人工智能研发者在开发和训练模型时极易背负侵权“原罪”。另一方面,《生成式人工智能服务管理暂行办法》要求人工智能服务提供者使用具有合法来源的数据和模型,对其施加了相对严苛的合规义务。由此,人工智能开发者和服务提供方在数据训练、数据输出等阶段往往面临著作权合法性困境。
(一)数据输入阶段存在的著作权侵权风险
目前,生成式人工智能已经形成了包括数据输入、模型训练、模型调优、内容输出等步骤的固定研发模式。在数据输入阶段,高质量的训练数据不仅可以提升人工智能模型的泛化能力和适应性,更能够帮助人工智能改善生成内容质量并避免算法的隐形偏见。而由于作品是典型的高质量数据集,开发者的数据输入行为往往蕴含著作权侵权风险,且这一风险难以通过事前授权或合理使用规则化解。
就侵权类型而言,数据输入行为主要涉及对著作权人复制权、改编权的侵犯。一方面,模型开发者往往通过爬取网页,扫描、翻印实物作品等方式获取训练数据,而此类行为被纳入复制权的规制范围内。《中华人民共和国著作权法》于2020年修订时新增了“数字化”这一复制方式,这意味着将纸质作品扫描为机器可读的数据格式也属于复制行为。同时,利用爬虫技术抓取数据的行为需要受到爬虫协议的约束,若未获许可爬取他人数据库中的作品,则不仅侵害了作品权利人的复制权,还可能构成对数据库权属方的著作权侵权。另一方面,为实现更好的数据训练效果,开发者会将数据进行删改、编码并添加噪声,这可能侵害著作权人的改编权与汇编权。有学者指出,对作品数据的压缩和结构化编排与传统的改编行为性质类似,都是在保留作品核心特征的基础上对作品元素进行提取整合,应受到改编权的保护。
在传统内容行业中,事前获取著作权人作品授权是常见的合规模式,但这一途径已经难以适应人工智能对海量训练数据的现实需要。首先,考虑到新一代人工智能所需的庞大数据规模,点对点的授权谈判将产生超出数据价值本身的交易成本,进而造成“著作权市场失灵”困局。其次,拥有丰富作品数据的网络平台往往倾向于自行研发人工智能模型并依赖优质数据提升自身的市场竞争力,并不具备对外授权数据的交易意愿。再次,由于作品数据本身缺少标准化的定价机制,人工智能企业和权利方对作品价值的预期相差甚远,导致授权交易难以正常进行。最后,数据、算法和算力是人工智能发展的三大要素,而我国人工智能企业已经消耗大量资本用于算法开发和算力购买,强制其支付高额授权费用将显著增加企业负担,损害我国人工智能产业的竞争力。
为应对数据输入带来的侵权风险,已有不少学者提出应重构合理使用制度或法定许可制度,将数据训练排除在著作权法的保护范围之外。但当前人工智能开发者仍以企业为主,其数据训练行为最终仍服务于商业目的,且后续模型输出内容可能对现有作品构成市场替代,这导致数据训练行为不能被解释入现行《中华人民共和国著作权法》设定的合理使用类型中。而法定许可制度同样存在定价困难、报酬支付成本高昂等问题,难以有效减轻人工智能企业研发负担。可见,化解数据输入阶段著作权侵权风险的可行路径仍有待进一步探索。
(二)数据输出阶段存在的著作权侵权风险
在数据输出阶段,生成式人工智能会综合训练数据和使用者给出的提示词,输出文字、音乐、图像等内容。此类生成内容可能与已有的自然人作品构成实质性相似,进而产生一系列著作权侵权风险。具体而言,数据输出阶段的著作权侵权风险主要有以下特点。
从侵权类型来看,人工智能生成物涉及的侵权种类更为多样,同时囊括著作人身权和财产权。首先,若人工智能模型利用了具有著作权的作品数据,并在此后输出了与该作品基本相同的内容,则构成对原作品复制权的侵害。与输入阶段的复制不同,模型输出阶段的复制行为直接面向公众,会造成更严重的侵权后果。其次,即便模型输出的内容具有一定的独创性,也可能因保留数据库中在先作品的表达元素而构成改编作品。如果未获得权利人的许可,这种数据输出行为就可能侵害改编权。再次,人工智能服务提供者与传统内容平台类似,都是应用户请求通过网络提供作品,若作品为侵权物则可能侵害信息网络传播权。最后,在特定情况下生成式人工智能也可能侵害他人的著作人身权。例如微软的“下一个伦勃朗”人工智能系统通过对伦勃朗的346件美术作品进行深度学习,具备生成类似风格作品的能力。若此类人工智能生成物被滥用,则可能影响原作者的声誉及社会评价。
从侵权主体来看,用户、研发者乃至服务部署者都可能成为侵权主体。在人工智能模型输出数据的过程中,各方行为都会对最终的生成内容产生影响,从而形成侵权判断的模糊地带。实践中,原告往往针对平台采取同时主张的诉讼策略,即主张人工智能服务提供者的数据输出行为同时构成直接侵权行为和协助用户侵权的间接侵权行为,以避免判断失败导致的不利后果。这种诉讼策略加剧了平台的法律风险,促使其投入更多成本进行侵权抗辩。
从归责方式来看,人工智能服务提供方往往被视为“风险的制造者”,难以主张技术中立免责。与传统的网络平台不同,人工智能服务商提供的规则和算法直接影响模型生成结果,是生成物侵权风险的主要控制方。为此,学界多认为人工智能服务商不能主张“避风港责任”而获得免责,而应主动承担过滤侵权结果的注意义务,甚至需承担无过错责任。相对地,考虑到一般用户难以判断模型输出数据是否侵权,除非主动输入侵权指令,否则无需对生成内容承担责任。
(三)数据类型的多样化与著作权合规之间的矛盾
生成式人工智能的训练数据几乎涵盖人类全部的数字化信息,不仅包括典型的网络信息、电子图书,还包括个人信息、公共数据乃至企业的商业秘密。多样化的训练数据不仅为人工智能企业制定著作权合规策略带来困难,也导致单纯的著作权合规难以应对人工智能训练过程中的多重法律风险。
从著作权内部出发,生成式人工智能的训练数据可被分为公有领域内容、孤儿作品、经编排的数据集和零散化的版权作品。对于公有领域内容,人工智能开发者无需获得授权即可直接利用。而对于已经进行结构化编排的商业化数据集,企业也可以向语料库企业批量购买或取得授权,问题主要存在于零散化的版权作品和孤儿作品。就前者而言,由于训练数据中的作品分属于不同权利人,企业不仅需要定位作品的来源,还需耗费大量人力物力核实作品的真实权利人。就后者而论,在企业利用孤儿作品进行训练后,孤儿作品的作者可能突然出现并主张权利,这就使得开发者面临侵权诉讼的风险。实践中,人工智能的训练数据可能同时包含以上几类且难以区分,这无疑增加了企业开展著作权合规工作的难度。
从著作权外部出发,生成式人工智能的训练数据除作品外,还可能包括个人信息、企业数据、敏感公共数据等信息类型,关涉个人信息安全、商业秘密保护、国家数据主权等多元利益。为确保合法合规地开发并部署人工智能模型,人工智能模型开发者不仅要保障训练数据不存在著作权侵权风险,更需制定全面完善的训练数据合规管理体系,以确保及时发现并解决潜在的法律问题。例如,当训练数据包含个人信息时,开发者需要遵循《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》的相关要求,确保已经获得了数据主体的明确授权,并且对数据进行适当的匿名化处理以实现隐私保护。
四、我国著作权法律制度的优化方向
在全球化和数字化背景下,我国著作权法律制度面临着前所未有的挑战与机遇。为了适应这一趋势,法律制度的优化成为必然。在署名与其他著作权行为的分离解释层面,署名权作为作者身份的标志,应当与作品的复制、发行、改编等经济权利相区分,确保作者的精神权利不受经济利益的影响,同时也为作品的合理使用和传播提供法律基础;在对既有规则的探索与突破性适用层面,在尊重现有法律框架的前提下,对规则进行深入探索,寻找适应新情况的解决方案,如对“网络环境下的著作权保护”“新型创作形式的法律地位”等问题进行创新性解释和适用。数据授权模式的优化与更新是适应数字时代需求的重要方向,随着大数据、人工智能等技术的发展,数据的收集、使用和共享成为著作权保护的新领域。法律制度应当对数据授权模式进行优化,明确数据使用者的权利和义务,促进数据的合理利用,同时保护数据创作者的合法权益。
(一)署名与其他著作权行为的分离解释
在探讨生成式人工智能著作权问题的制度回应时,一个不可忽视的议题是署名与其他著作权行为的分离解释。这一议题的核心在于如何界定人工智能生成内容的著作权归属,以及如何在保护创作者权益的同时,促进作品的合理使用和传播。目前,我国现行著作权法将作者的身份限定为自然人、法人和非法人组织,而并未将人工智能纳入作者的范畴。人工智能作为非自然人主体,其生成的内容虽然可能具有独创性,但在法律上并不具备署名的主体资格,这导致了人工智能生成内容的著作权归属和标注义务在现行法律体系中难以得到明确解释。因此,需要立法进行适当的调整,以平衡技术发展需求与创作者的合法权益。
署名权作为著作权法中的一项基本权利,在传统意义上是与作者的人格利益紧密相连的。根据我国著作权相关法律,署名权属于著作人身权,保护作者的名誉和身份,这一规定明确了著作权主体的法律地位,确保了著作权法的适用与执行具有确定性。在人类作者创作的背景下,署名权的行使通常与作品的创作过程和创作结果直接相关。而在人工智能创作的背景下,署名权的行使应当与作品的其他著作权行为,如复制权、发行权、改编权等经济权利相分离。这种分离解释的提出,是基于人工智能生成内容的特殊性。人工智能作为一种工具或平台,其创作过程并非传统意义上的人类智力创作,因此,将署名权严格限定于人工智能开发者或使用者,可能更符合实际情况。同时,这种分离也有助于明确人工智能生成内容的版权归属,为后续的作品使用和传播提供法律依据。
进一步而言,署名与其他著作权行为的分离解释,还涉及对人工智能生成内容的法律定性。在《伯尔尼公约》中,作品的定义并未明确排除人工智能创作的作品,但公约也强调了作者的国籍或作品的首次发布地等要素。这意味着,即使人工智能创作的作品可以被视为受著作权法保护的对象,其著作权的行使也需要在国际法律框架下进行考量,从而确保署名与其他著作权行为的分离解释得以妥善实现。
在实践中,署名权的分离解释可以采取多种方式。例如,可以要求在人工智能生成内容上明确标注“人工智能创作”或类似字样,以区分传统意义上的人类创作。目前,对人工智能或人工智能生成内容的标注义务已经被多个国家和地区列为法定义务,但该类要求并未从著作权法的角度被解释为署名行为。同时,可以为人工智能生成内容设立特殊的著作权登记制度,以便在著作权登记、许可和转让等方面提供便利。此外,署名与其他著作权行为的分离解释,还应当考虑到公共利益的平衡。著作权法的目的在于鼓励文学、艺术和科学作品的创作与传播,人工智能创作的作品在丰富文化市场、促进知识共享方面具有潜在价值。因此,在对人工智能生成内容进行著作权保护的同时,也应当保障公众对作品的合理使用,例如通过规定合理使用的范围和条件,确保文化创作的多样性和创新性。署名与其他著作权行为的分离解释,是应对人工智能生成内容著作权问题的一种可行路径,强调署名的标识属性,表明作品出处,不仅有助于明确人工智能生成内容的法律地位,还能够在保护创作者权益和促进作品传播之间找到平衡点。
(二)既有规则的探索与突破性适用
人工智能的快速发展对传统的著作权法律制度与规则提出了全新的问题,尤其是在作品属性的认定、作者身份与权利归属、数据训练的合法性,以及合理使用与避风港规则等方面,人工智能技术的研究逐步走向深化,与人工智能相关的工业、产业和行业逐步成熟细化,完善和重塑人工智能生成内容的既有著作权规则显得尤为迫切。
关于人工智能作品的属性认定,北京互联网法院在“Stable Diffusion案”中明确了人工智能图片可以被视为受著作权法保护的美术作品,这表明法院在认定独创性时采取了“独立性+创造性”的路径,强调了图片的布局设计和画面元素体现原告个性化表达的重要性。这一判决为人工智能作品的著作权保护提供了司法实践的支持,对原著作权法律制度进行了外延性探索与适用。对于作者身份与权利归属问题,传统著作权法将作者限定为自然人、法人或非法人组织,而人工智能的参与使得这一定义变得模糊。如上文所言,将署名权与著作权的其他权利分离,通过合法购买与合同约定风险承担等方式,解决人工智能著作权归属问题。这种分离有助于明确人工智能生成内容的版权归属,同时保障创作者的权益,为现行著作权法中关于著作权归属的解释和应用提供更为合理的视角。
生成式人工智能的训练过程需要大量数据,经常会涉及他人作品的著作权,可借鉴早期互联网治理规则,在现有著作权法律制度中,引入合理使用原则和避风港机制,同时通过集体管理组织集中授权,建立开放授权的数据资源,以促进人工智能的健康发展。合理使用原则可以为人工智能的数据训练和输出提供一定的法律空间,而避风港规则可以为人工智能服务提供者在一定程度上减轻侵权责任。这些规则的适用需要在保护著作权的同时,考虑到技术发展和公共利益的平衡。在现行著作权规则框架下,人工智能生成内容的署名现实总体上呈现无法可依的状态。起源于自然人对创作领域的独占和垄断现实的著作权署名规则,并不能为人工智能生成内容的风险治理提供科学合理、公开透明的制度参照,人工智能生成内容的著作权署名规则亟待适应人工智能技术的发展和实践而重塑。因此,我国著作权法律制度在面对人工智能的挑战时,需要在既有规则的基础上进行探索与突破性适用,以实现产业发展与技术升级规范措施保障之间的最佳平衡。
(三)数据授权模式的优化与更新
数据授权模式作为连接人工智能训练与应用的桥梁,其优化与更新显得尤为重要。数据授权是指数据所有者将其数据授权给其他第三方使用的过程,这些数据在人工智能算法的训练和优化中起着关键作用。当前的数据授权模式在生成式人工智能领域面临着诸多挑战。生成式人工智能模型需要海量数据进行训练,可能包含个人隐私或商业机密,一旦泄露将对个人和企业造成巨大损失。同时,生成式人工智能模型的性能很大程度上依赖于训练数据的质量,低质量的数据不仅会降低模型的准确性,还可能引入偏见和误导性信息,而现有数据授权模式难以适应生成式人工智能技术的快速迭代。
我国著作权法律制度在优化数据授权模式时,可以从强化数据安全与隐私保护、提高数据质量评估标准、灵活应对技术迭代需求,以及完善相关法律法规体系等几个方面综合推进。第一,数据安全与隐私保护需要在数据授权过程中建立健全的数据安全与隐私保护机制,通过技术手段加强数据的加密存储和传输,防止数据被截获或篡改,明确数据授权方和使用方的数据安全与隐私保护责任,制定严格的数据使用规范和违约责任条款,同时引入数据信托、数据沙盒等新型数据治理机制,提高数据授权过程的透明度和可信度。第二,数据质量评估需要建立科学、客观的数据质量评估体系,对数据的完整性、准确性、时效性进行全面评估,鼓励数据授权方和使用方共同参与到数据质量评估过程中,形成良性互动机制。对于低质量的数据,需要明确其处理方式和责任归属,通过技术手段提高数据质量或限制其使用。第三,在技术迭代中,需要构建灵活、高效的数据授权模式,以促进数据资源的共享和流通。包括鼓励数据授权方和使用方建立长期稳定的合作关系,共同推动生成式人工智能技术的创新和发展。同时,还需要充分考虑技术的多样性和复杂性,制定相应的数据授权方案和政策措施,明确数据授权方和使用方的权利义务关系以及法律责任承担方式,加强对数据授权过程的监管和执法力度,防止数据滥用和侵权行为的发生。最后,还需要关注国际版权法律制度的最新动态和发展趋势,完善我国著作权法律制度,以与国际规则接轨和协调。
人工智能生成内容的著作权合法性面临着制度难题,而数据授权模式的优化与更新正是解决这一难题的关键路径之一。通过强化数据安全与隐私保护、提高数据质量评估标准、灵活应对技术迭代需求以及完善相关法律法规体系等措施,可以推动我国著作权法律制度的进一步完善和发展。同时,这也将为生成式人工智能技术的持续创新和发展提供有力保障和支持。
五、结语
国务院在《关于印发新一代人工智能发展规划的通知》中指出,人工智能是引领未来的战略性技术,影响着我国在新一轮国际科技竞争中的地位。作为新一代人工智能重要技术路径的代表,生成式人工智能在与社会生活密切互动的同时,也为现有著作权法律制度带来了新的挑战。然而,现有的著作权体系并未有效回应人工智能生成内容的作品属性、作者认定以及权利归属等现实问题,反而以过于严苛的侵权判断规则抑制了模型训练数据的采集和应用,阻碍了高质量作品的产生和我国人工智能产业的发展。为此,有必要在稳固现有著作权法基本原则的基础上,对著作权制度进行适当的调适和发展。一方面,应当肯定具有独创性的人工智能生成内容受到著作权法保护,并将相关权利归属于生成式人工智能的使用方,以激励其借助人工智能技术进行创作。另一方面,应当尝试在人工智能数据训练活动中引入合理使用制度和避风港原则,并积极探索高效、安全的数据授权模式,以平衡权利人保障和人工智能产业发展的现实需要。(参考文献略)
作者:
张平 北京大学法学院教授,北京大学人工智能研究院AI安全与治理中心主任,北京大学武汉人工智能研究院副院长
南方传媒研究 2024年第5期总110期
欢迎订阅《南方传媒研究》
本刊邮发代号:46-582
本刊唯一投稿、合作邮箱:
nfcmyj@163.com金华股票配资