• 收藏
  • 加入书签
添加成功
收藏成功
分享

生成式人工智能训练中著作权保护与作品利用的冲突与协调

西部文化媒体号
青岛大学

摘要:《生成式人工智能服务管理办法(征求意见稿)》第七条提出了生成式人工智能训练数据的合规要求。但由于生成式人工智能模型的形成和完善依赖于大量的数据训练,用于训练的数据又不可避免地包含受著作权法保护的内容。在《著作权法》合理使用法定主义的当下,著作权保护与版权作品利用的冲突已愈发明显。为缓解这一冲突,应当拓宽著作权合理使用范围,构建利益分享制度及作品退出机制,使生成式人工智能训练过程的作品使用合法化,并平衡生成式人工智能服务提供者与著作权人间的利益。

关键词:生成式人工智能;著作权保护;合理使用;作品退出;利益平衡

第一章 引言

《生成式人工智能服务管理办法(征求意见稿)》(下称办法)第七条规定:提供者用于人工智能产品的预训练、优化训练数据不含有侵犯知识产权的内容。该条将要求提供者对训练数据合法性承担注意义务,否则承担侵权责任。但是,由于生成式人工智能(Generative Artificial Intelligence,下称GAI)训练数据源自对版权作品的挖掘,在我国合理使用法定主义模式下,对训练数据挖掘行为很难构成合理使用,存在较大著作权侵权风险。[1]而现行的授权许可模式引发的“寒蝉效应”及高门槛同样不可忽视。如何构建数据训练免责机制,平衡数据使用与著作权保护,值得探讨。

第二章 使用不清洁数据训练的侵权责任与作品利用困境

GAI数据训练的著作权侵权风险之所以受关注,根本原因在于GAI模型的形成及完善离不开大量包含版权作品的训练数据。而当下“合理使用”规则对GAI训练数据挖掘问题仍同虚设,急需立法加以明确。GAI数据训练时,因难以构成合理使用,提供者极有可能承担侵权责任。同时,授权使用管理困难与成本高昂导致该模式存在适用困境。

一、合理使用困境

当前《著作权法》对于合理使用规定了三个主要路径,即“个人使用”“适当引用”“科学研究”。[2]

“个人使用”要求著作权使用无商业目的,这与GAI训练的最终目的——提供商业化服务难以嵌合;“适当引用”系“为介绍、评论说明某一作品”或“说明某一问题”,GAI训练对数据的利用显然不入此列;“科学研究”存在“学校课堂教学或者科学研究”的限制,只能“少量复制”,与GAI训练庞大的数据需求背道而驰。[3]可见,有针对性地拓宽对数据训练的合理使用范围已决不待时。

二、授权许可困境

学者形象地将GAI模型与训练数据,比喻为“孩子”与“母乳”。[4]GAI的发展与提升必须依托体量庞大的数据训练。现行《著作权法》视野下,GAI训练对数据的合法利用仅剩“授权许可模式”,但该模式在GAI训练中亦难以适用。

第一,授权许可将导致GAI研发成本高昂,引发“寒蝉效应”。提供者面对高昂授权费时,或选择放弃GAI研发而导致我国GAI技术发展停滞;或使用免费数据开发引发算法偏见等后果。

第二,授权模式难以落地。GAI训练数据体量大、种类多,授权许可首先要将版权作品分离、提取;其次,需要和每一位权利人协商授权。面对海量数据,上述程序无法实现。

第三,授权许可管理失灵。著作权可以委托集体管理组织统一管理。但是,GAI训练对作品量的需求已远远超出管理组织能调控与规制的范畴。

第三章 著作权保护与GAI发展的权益平衡及进路

为解决上述问题,可增设“合理使用”,对著作权法24条兜底条款进行明确,并构建“利益分享”“作品退出”机制,寻求著作权保护与作品利用的平衡。

一、增设新的“合理使用”

新《著作权法》第24条对“合理使用”增加“法律、行政法规规定的其他情形”这一兜底条款。因此,有学者提出:应拓展合理使用范围,[5]将GAI训练数据挖掘置于合理使用之中,以协调著作权保护与GAI发展,该主张具有合理性。

第一,著作权法以“促进社会主义文化和科学事业的发展与繁荣”[6]为宗旨,为人工智能增设数据训练合理使用,具有应然性。

第二,GAI训练依托大量数据,这些数据不可能一一取得著作权人明示同意,只能依靠著作权合理使用解决。[7]

第三,日本和欧盟为当前GAI版权侵权治理提供了可借鉴的路径。如2018年日本《著作权法》增加若提供者对作品的使用“不侵害著作权人利益”或者“对著作权的损害程度轻微”,可不经许可直接使用。[8]欧盟2019年《单一数字市场版权指令》,规定创设文本与数据挖掘的例外,[9]域外实践取得一定效果,可为我国参考。

综上,可通过司法解释为GAI数据训练增设合理使用情形,使用符合标准的部分,可不经著作权人许可。同时,为避免提供者滥用“合理使用”,保证著作权人的选择权,应为著作权人创设声明拒绝使用的权利。

二、构建利益分享机制

简单允许GAI数据训练构成合理使用,对于著作权人是不公平的,应在二者间构建利益分享机制。如有学者提出对人工智能提供者“征税”[10],按提供者的盈利多少收费,并将费用用于GAI开发的政府补贴等,推进GAI技术发展。

利益分享机制的建立,一方面能促进GAI技术及行业发展,另一方面能够实现《著作权法》保护著作权,激励创作的立法宗旨,实现各方利益平衡。

三、构建作品退出机制

在“合理使用”中,著作权人应有声明拒绝的权利,该权利不仅包含版权人声明禁止;还包括GAI训练时,著作权人有权向提供者发出拒绝使用的声明。为实现上述目的,应为版权作品构建退出机制。

首先,著作权人可以作出拒绝提供者在GAI训练中使用其版权作品的声明,对于存在声明的作品,提供者不得纳入GAI训练数据中。

其次,提供者在将版权作品纳入GAI训练数据时,应搭建网络平台将用于训练的数据公示,并建立有效的版权作品检索渠道,让著作权人可以方便地了解到其作品是否被使用。并给予版权人一定的时间,决定是否在训练数据中保留或删除、屏蔽其作品。[11]若著作权人未在规定期内明示拒绝,则默认允许其作品用于数据训练。实操层面,GAI提供者收到著作权人声明后,应进行评估,并对确为侵权的内容进行删除或屏蔽。

从技术上讲,随着信息技术的发展,提供者针对信息的审查能力逐步提高。[12大数据、人工智能等技术的成熟也使得退出机制的搭建具备可行性。

结语

GAI技术在当今社会作用愈发明显,数据训练作为GAI技术的根基,立法既要迎合技术发展的浪潮,赋予GAI提供者利用作品的自由,又要对著作权人的“固有利益”加以保障,从而实现现行法的整体协调。在此基础上,增设数据训练合理使用规则,构建利益分享及作品退出机制,不失为平衡多方利益的好办法。

作者简介:

参考文献:

[1] 毕文轩:《生成式人工智能的风险规制困境及其化解:以ChatGPT的规制为视角》,载《比较法研究》2023年第3期。

[2] 《著作权法》第24条第1款第1、2、6项

[3] 朱开鑫、张艺群:《“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题》,载微信公众号“腾讯研究院”,2023年3月1日。

[4] 吴汉东:《人工智能生成作品的著作权法之问》,载《中外法学》,2020年第3期。

[5] 高莉:《数字时代著作权合理使用制度的检视与重构——基于技术中立的理论分析》,载《苏州大学学报(法学版)》2023年6月19日,https://kns.cnki.net/kcms2/article/abstract?v=uGgCwAjnz5HKx8jODWe2t_oAEHKuypFtFPJbSEPCGqJY8DmePNaDvLAyhsEPcRUmP3JyKHdAF_N3k3ANYzYaZzyBuyuDw6Gu2SJXIKuDwp-Y6qIikcYl4Q==&uniplatform=NZKPT。

[6] 《著作权法》第1条

[7] 王楷文:《人工智能数据输入与著作权合理使用》,载《文献与数据学报》,2021年第2期。

[8] 日本《著作权法》第30-4条第(1)款;郑重:《日本著作权法柔性合理使用条款及其启示》。载《知识产权》,2022年第1期。

[9] 欧盟《单一数字市场版权指令》第2章第3条、第4条;万勇:《人工智能时代著作权法合理使用制度的困境与出路》,载《社会科学辑刊》,2021年第5期。

[10] 索贝尔:《人工智能的合理利用危机》,载《哥伦比亚法律与艺术杂志》,2017年第1期。

[11] 朱晓睿:《版权内容过滤措施与用户隐私的利益冲突与平衡》,载《知识产权》,2020年第10期。

[12] 谢晶:《数字环境下著作权默示许可制度研究》,中南财经政法大学2020年博士论文。

作者简介:姜琦(1999年3月3日),性别男,民族汉族,籍贯山东省栖霞市,单位全称:青岛大学,职称/职位:研究生在读,研究方向:民商法。

*本文暂不支持打印功能

monitor