• 收藏
  • 加入书签
添加成功
收藏成功
分享

论生成式人工智能侵权的场景化归责

陈瑞芬
  
大通媒体号
2025年155期
湖北民族大学 法学院

[ 摘 要 ] “发展即风险”,生成式人工智能快速发展在推动社会进步的同时,也带来了复杂的责任认定难题。其应当采用控制力标准及利益分配原则,通过动态平衡权益,同时保障技术创新、维护社会公平。本文基于场景化分析框架,结合生成式人工智能技术特征,提出“控制阶段- 传播阶段”的二元场景划分,主张在控制阶段对开发者适用无过错责任、监管者适用过错推定;在传播阶段对运营者和开发者适用过错推定、使用者适用过错责任、监管者适用无过错责任,为完善我国人工智能治理提供相关建议。

关键词] 生成式人工智能;场景化归责;区分原则;实现路径

一、问题的提出

在新科技革命和产业变革的大背景之下,人工智能作为新质生产力与产业深度融合,是加快我国社会主义市场经济高质量发展的必然选择,推动着人类社会迈向新纪元。在《纽约时报》刊载的与 ChatGPT 对话的文章中,其陈述了自己并非人类,但渴望成为人类的想法。技术跃迁总是风险重构的过程,作为人工智能的基础支撑,数据信息安全的绝对性已然不复存在,每个人都随时会成为信息泄露的被侵权人,随着违法行为成本的降低,每个人也随时会成为侵权人。在开展“人工智能+”的行动政策精神及发展可信人工智能全球背景的共识下,法律是保障人工智能可信向善发展、约束违法行为,避免成为权利清洗器的主要手段。

二、生成式人工智能的技术机理与法律属性

(一)生成式人工智能的技术机理

在分析生成式 AI 侵权责任时,深入理解其技术原理及其对法律领域产生的潜在影响至关重要。生成式 AI 以大语言模型为核心,其中,Chat GPT3.0 训练时用到的数据量是 1750 亿个参数大约 45TB 的文本数据,相当于美国国会图书馆藏书的四分之一,且与传统决策式 AI 相比,其显著特点在于创造力。这一创造力的体现贯穿于生成式 AI 运行的三个关键阶段。首先是数据收集和预训练阶段。在此过程中,模型采用无监督学习方式,在未标注的文本中探寻结构化特征。将用户输入的文本进行 token 化处理,进而构建基座模型并开展学习训练。其次是微调阶段。这一阶段主要对基座模型进行优化,不再从海量文本中学习,而是聚焦于用户输入的高质量、专业化对话,采用监督学习,使模型进一步适应特定任务需求。最后是推理阶段,模型依据已有的文本标识,结合当前数据文本和用户输入的提示指令,推理出概率最高的结果。然而,大模型无法真正理解文本在人类世界的含义,只能依据概率生成内容,这便是导致幻觉现象产生的原因。虽然研究人员尝试使用各种方式缓解大模型“幻觉问题”,但 DeepSeek 的测试表明,似乎大模型能力越强,模型的幻觉问题越令人信以为真。

(二)生成式人工智能的法律属性

1. 在探讨完生成式AI 的技术机理之后,需要对其法律属性进行进一步探讨。学界大多数目前主要有三种不同的观点。第一,否定说。从工具学角度出发,基于其行为完全由预设程序决定,因此认为生成式 AI 属于人类生活学习的工具。但这种观点亦存在逻辑漏洞,生成式AI 本身具备强大的自主决策力,并且其产出的内容也可被其他 AI 循环学习,形成客观因果链,违背了工具论前提。第二,肯定说。1 根据耶林的目的法学论,肯定说是为了通过规则创新平衡权益保护与技术发展,主张通过拟制人格或电子人格方式赋予其民事主体地位,该观点是值得商榷的。拟制人格理论缺乏法人赖以存在的“组织意志”基础,无法直接移植适用,且肯定说未能解决AI 主体的责任财产问题。第三,折中说。主张赋予 AI 有限民事主体资格,该学说试图在 AI 工具属性与人格拟制间寻找平衡,但其有限人格的具体边界仍需法律进一步明确。2

2. 笔者认为,虽然目前正处于向强人工智能转变的阶段,但其本质还是算法、算力、数据的结合。因此直至目前,生成式 AI 作为人类的工具化使用性更强。其属性定义为产品还是服务,学界仍有讨论余地。然而我们要看到设立产品责任的目的,基于产品是同质化、大量、无差别地投放在市场上的,如果出现了产品缺陷致人损害,应当对生产者和销售者适用严格责任。对于生成式人工智能而言,其虽然是以软件客体为载体,但本质是为用户提供个性化定制服务,所生成的内容受到人机交互的差异与算法模型变化的影响,欠缺高度的大众化特征,不具有普适性,应当认定为服务。

三、生成式人工智能侵权归责的场景化构筑

(一)生成式人工智能侵权场景化归责构筑的正当性

生成式人工智能是科技迭代进步过程中的“破坏性创新”产品,其创新方式、产品生成机理、涉及法律关系以及产品责任归属均与传统生产关系不一样,应当采用区分原则,进行场景化归责。 主要有以下三个方面的原因。

1. 技术自主性程度:生成式 AI 因独有的“创造力”,其在运行阶段自主性程度高,不完全取决于人类指令。自 2012 年 AlexNet 在图像识别领域取得突破性成就以来,深度学习引发了人工智能研究的一场革命。4 其中 BERT 模型通过 Transformer 架构实现了深度双向语境的表示学习,而 GPT 系列模型则通过大规模的语料库预训练,学习语言的深层结构和丰富的语义信息,从而在多种自然语言处理任务上达到如今的效果。5 这种能力使得模型能够从海量数据中提取知识,且在运行阶段可以根据用户的输入、场景的切换等不同要素,适应新任务,不断优化性能。

2. 使用场景的社会风险等级:现代社会是风险社会,生成式人工智能侵权场景也不例外。从风险的预防控制能力和解决能力,划分风险管理等级以实现最优的资源分配和效果达成。6 在控制阶段,存在模型训练数据的合规性、算法的偏见与漏洞等问题,若未得到有效把控,会形成侵权隐患;而在传播阶段,AI 生成内容的扩散可能带来更大范围影响,虚假信息借助社交媒体快速传播,危害公共安全与社会稳定。

3. 经济效益性:经济性是指使投入的资源得到最大限度地节约,使产出的成果达到最大化。8 马克思在《资本论》中指出,劳动首先是人和自然之间的过程,是人以自身的活动来引起、调整和控制人和自然之间的物质变换的过程。生成式人工智能投入规模化应用后,传统劳动的概念与形态受到了现实挑战。在技术飞速发展时期,不应制定过于严苛的安全标准给企业增加过高合规成本,而应兼顾科技伦理与技术创新。9 通过采用区分原则,构筑不同场景之下,各主体之间的责任边界,减少因责任模糊导致的诉讼成本和合规成本。10

(二)生成式人工智能侵权归责的构筑场景

人工智能的责任承担以可解释调整为以可控制为中心,体现出控制力水平与风险预防能力呈正相关关系。11 基于利益相关者理论框架,生成式人工智能的治理应当构建分层次、多主体治理机制,这种差异化治理范式充分考虑了不同维度治理需求。12

1. 第一,控制阶段,主要包括数据收集、模型建构、数据训练阶段。13本文认为在该阶段应当对开发者适用无过错,对监管者适用过错推定。

(1)第一,控制阶段具有明显的内部性特征,对数据语料的训练、调整可能会使用未经授权的资源或是通过价值观嵌入使 AI 行为背离伦理准则,而生成式 AI 的深度学习和语料库建立过程是不对外开放的,人机交互性较低,控制主体如开发者只是单向性地获取、训练海量数据资源。通过引入无过错责任,可以激励提供者、使用者预防损害的发生,从实质公平上分配举证责任。14 有些学者也提出质疑,认为对开发者采取严格责任,会抑制科技产业的蓬勃发展。本文持相左意见。当前科技产业存在快速迭代忽略安全、滥用用户数据倾向,而严格责任将会迫使企业增加前期安全风险投入,优化产品生命周期,倒逼企业实现质量优先,避免劣币驱逐良币,亦能增强公众对于产业发展的技术信任。

(2)第二,从风险规制出发,风险的作用之一就是匹配责任风险与可得利益,并尽可能避免单一主体承担无限责任的情形产生。 开发者通过控制训练数据与算法架构获取商业利益。同时,人工智能服务的每一次使用都需要提供者保障人工智能的运行条件,包括运行所需要算力、网络、模型能力等,提供者不仅能够从前端控制人工智能的生成内容,还能对后端生成的侵权内容采取删除等技术措施,能够以最小的成本防范风险。16

(3)最后,监管者作为数据安全和社会风险的监督管理者,本应承担严格责任,但由于现有人工智能侵权责任的特殊性,其监管强度必然受预算成本与信息约束。 采取过错推定原则实质是信号筛选机制,这样既避免监管真空,又防止过度干预创新,增强法律的现实性和可操作性。

2. 第二,传播阶段,亦称为商业化应用阶段,主要涵盖生成文本内容、产生侵权事件、采取救济措施等流程。

(1)人工智能侵权较为特殊,其决策过程具有技术黑箱性和自主演化性,行为与结果的发生并不完全具有主客观的关联性,并且大部分损害结果发生需要经过公开传播,不同于传统的侵权场景。本文认为应当对开发者和运营者适用过错推定原则,二者承担不真正连带责任,受侵权人可以择一行使;对使用者适用过错原则;对监管者适用无过错原则。此时监管者的严格责任作为保障社会安全的最后一道防线,有利于促发展、保安全。

(2)首先,平台运营者掌握着生成式 AI 的分发渠道、过滤机制和收益分配权,且对于人工智能服务来说,提供者应当作为首要责任主体,使用者作为辅助责任主体,两者之间可以通过设置妥当的避风港规则来划分责任边界。18 如在任甲玉及金德管业集团有限公司诉北京百度网讯科技有限公司名誉案中,北京市第一中级人民法院的判决确认搜索引擎运营者对自动生成内容不负有事前一般性审查义务的规则,不宜对其适用严格责任,通过合理界定双方责任边界,对服务提供者适用过错推定原则。19 王若冰则认为,在认定生成式人工智能服务提供者的过错时,应当以现有技术水平作为判断标准,适用过错责任原则,且在现有技术水平下需要考虑时间维度、行业维度和地域维度。20 但法律可操作性较低,即现有技术的标准无法实现量化同一。其次,使用者需要根据过错程度归责。 使用者对于生成式人工智能的风险也具有相当的控制力,使用者的个性化需求以及人机之间的互动交流也可能影响生成式人工智能的输出结果,如使用者故意诱导或者误导人工智能,同时还决定着生成内容的下一步使用。22 此外,AI 工具的普及使得单个用户可造成大规模侵权,此时适用过错责任能够更好地规制用户自律,即用户应当承担合理的使用责任。 但开发者由于技术缺陷的持续性影响,没有部署基础的内容过滤措施,即便侵权由用户直接引发,其仍需承担相应的补充责任。最后,监管者作为公共利益的守护者角色,其通常不介入具体侵权纠纷,但如果出现了类似“网络开盒”事件等大量侵犯个人隐私的恶性社会事件,监管者应当承担无过错责任,为社会安全筑好最后一道防火墙。

四、生成式人工智能侵权场景化归责的实现路径

(一)控制阶段的场景化归责实现路径

在生成式人工智能侵权场景中,权利主体往往难以就其实际损害进行精确举证,而服务提供者同样难以准确量化其因侵权行为所获收益。这种双向的举证困境导致损害数额难以通过传统侵权损害赔偿计算方法予以确定,因此赔偿金需要以法定或者酌定方式设立。赔偿基金运作需建立行业统一的风险准备金制度,可参照自动驾驶领域《事故救助基金管理办法》,按企业年度销售额的 1%-3% 计提资金,纳入专用账户统一管理。该基金的核心价值在于构建双向通道:当侵权纠纷发生时,基金可先行向权利人支付赔偿金,避免因责任认定周期过长导致的权益受损;同时,基于数据治理双循环体系追溯的责任主体信息,基金管理方有权向违规企业追偿,既保障权利人及时获偿,又通过追偿机制倒逼企业强化合规管理,实现风险补偿与责任约束的双重目标。

(二)传播阶段的场景化归责实现路径

王利明教授认为,利用生成式人工智能实施侵权与利用网络实施侵权在性质上具有“评价重心”的相似性,因此,AI 生成虚假信息的侵权行为应当类推适用“通知规则”。24 在生成式AI 侵权治理中,“通知 - 删除”规则为服务提供者划定责任边界,形成“用户监督 - 平台响应 - 责任豁免”机制。用户发现侵权可提交含定位与权属证明的通知,平台需在 24 小时内核查删除并阻断传播,对未及时处理扩大部分担责。该规则平衡技术发展与权益保护:既避免要求平台全量前置审查,又通过“通知触发义务”促平台建注意机制。平台尽到合理注意义务可免责,在不阻碍技术进步与不纵容侵权间找到平衡。

五、结语

2017 年,国务院发布《新一代人工智能发展规划》首次将 AI 上升为国家战略,提出“三步走”目标,明确要求发展智能内容生成技术。安全与风险总是相对的,法律既要从前端解决人工智能的风险控制,预防风险的发生,也需要从后端关注人工智能的风险分配。法律体系是经济社会运行的基石,生成式人工智能的法律治理在我国的发展从来都不是一种自洽、自闭的过程或活动。因此,完善相关法律法规,提升其参与生成式 AI 发展过程中的挑战与风险的实际治理效能,进而围绕多元主体、多层治理,形成治理合力,就成为当前生成式 AI 发展应当直面的“真问题”,也将成为中国特色社会主义法治理论的有机组成部分。

1 Shawn Bayern 提出“自动法人”理论,论证具备自主决策能力的人工智能系统可类比有限责任公司。

2 折中说理论落地面临诸多矛盾。欧盟 2016 年机器人法提案的流产表明,“有限人格”的模糊边界会导致开发者以 AI 自主性抗辩,用以技术不可控推诿,最终损害救济落空。其本质上仍是对传统法律体系的修补,未能根本解决AI“非人非物”的身份困境。

3 破坏性创新(Disruptive innovation) ,也被称为颠覆式创新,由哈佛大学克莱顿·克里斯腾森教授在《创新者的两难》一书中提出,通常指采用新功能、新模式、新方法扩大和开发新市场,反过来,也有可能会破坏与现有市场之间的联系。

4 2012年Alex Net凭借深度卷积神经网络(CNN)在Image Net竞赛中取得突破,证明了数据驱动端到端学习的强大能力,开启了深度学习革命。此后,算法、算力和大数据的进步推动 AI 跨越式发展,渗透到视觉、NLP、语音等领域,并催生了 Chat GPT 等大模型,但数据依赖、可解释性等挑战仍待解决。

5 BERT 模型偏向高精度文本分析,如法律合同条款解析;GPT 模型则追求创造性输出。

6 赵鹏:《“基于风险”的个人信息保护?》,载《法学评论》2023 年第 4 期;梅夏英:《社会风险控制抑或个人权益保护— 理解个人信息保护法的两个维度》,载《环球法律评论》2022 年第 1 期;张涛:《探寻个人信息保护的风险控制路径之维》,载《法学》2022 年第 6期;洪延青:《国家安全视野中的数据分类分级保护》,载《中国法律评论》2021 年第 5 期。

7 例如 Getty Images 指控 Stability AI 在训练 Stable Diffusion 模型时未经授权复制了其 1200 余万张版权图片,构成大规模版权侵权;2024 年法院初步认定水印移除行为违反《数字千年版权法》。

8 该理论为 AI 版权纠纷提供了量化分析框架,但需与人格权理论或公平正义原则协同适用,避免陷入“唯效率主义”陷阱。当前欧盟 AI法案中的“数据文本与挖掘例外条款”(TDM 例外)即体现了此理论的立法影响。

9 林洹民:《论人工智能立法的基本路径》,载《中国法学》2024 年第5 期。

10 区分原则是指在生成式 AI 法律关系或法律适用中,在不同场景之下,对不同性质的主体或行为进行明确区分,以确保法律规则的精准性和公平性。

11 参见袁曾:《生成式人工智能责任规制的法律问题研究》,载《法学杂志》 2023 年第44 卷第 4 期,第 119-130 页。

12 王家宝,胡晴宇:《利益相关者视角下生成式人工智能治理问题与对策研究》,载《领导科学》2025 年第4 期,第113-122 页。

13 生成式 AI 的可控制阶段是通过技术过滤、人工审核、伦理对齐等手段,确保其输出安全、可靠且合规的过程,典型场景如医疗和金融需附加免责声明等限制。

14 参见赵精武:《论人工智能法的多维规制体系》,载《法学论坛》2024 年第3 期。

15 [德]罗伯特·鲍德温、马丁·凯夫、马丁·洛奇编:《牛津规制手册》,宋华琳、李鸻、安永康、卢超 译,上海三联书店2017 年版,第 377 页。

16 参见徐伟:《论生成式人工智能服务提供者的法律地位及其责任———以Chat Gpt 为例》,载《法律科学(西北政法大学学报)》2023年第 4 期。

17 监管者在国内主要包括网信办、发改委、国家广电总局等掌握大数据信息且具有一定行政能力的机构或部门。

18 参见徐伟:《论通知规则在生成式人工智能侵权中的适用》,载《现代法学》2024 年第3 期,第145-146 页。

19 自然人任甲玉在百度搜索引擎中输入“任甲玉”,页面“相关搜索”处显示有“陶氏任甲玉”等,因“陶氏”口碑不佳,任甲玉以“相关搜索”处的内容侵害其名誉权、姓名权和被遗忘权为由,要求百度公司承担侵权责任。法院认为“相关搜索”中任甲玉及陶氏教育相关的内容是对网络用户搜索相关检索词内容与频率的客观反映,属于客观、中立、及时的技术平台服务,百度公司对“陶氏任甲玉”等关键词在搜索结果中出现并不存在主观过错。见任甲玉诉北京市百度网讯科技公司侵犯名誉权、姓名权、一般人格权纠纷案,北京市第一中级人民法院 ( 2015) 一中民终字第 09558 号民事判决书。此外,金德管业集团有限公司在百度搜索输入“金德”等检索词时,“相关搜索”处出现“金德骗子”“金德管业骗子”“金德管业招聘黑幕”等内容,对百度公司提起诉讼。法院认为,百度公司并不承担对庞大数据信息出现前的逐一审查义务。见金德管业集团有限公司诉北京百度网讯科技有限公司名誉权案,北京市第一中级人民法院(2009) 一中民终字第 17680 号民事判决书。

20 参见王若冰《论生成式人工智能侵权中服务提供者过错的认定——以“现有技术水平”为标准》,载《比较法研究》2023 年第 5 期,第 20-33 页。

21 使用者的“提示工程”可以分为两种类型。一是正当行为。用户在输入正当提示词后,由于系统内部缺陷或是运营不当导致侵权。二是诱导行为。假使用户输入“生成与《活着》第5 章相同的文本”时,此时带有明显的侵权故意,属于诱导生成式AI 输出侵犯他人民事权益行为。

22 参见周学峰:《生成式人工智能侵权责任探析》,载《比较法研究》2023 年第4 期。

23 参见徐继敏《生成式人工智能治理原则与法律策略》,载《理论与改革》2023 年第5 期,第 72-83 页。

24 参见王利明:《生成式人工智能侵权的法律应对》,载《中国应用法学》2023 年第5 期,第 27-38 页。

*本文暂不支持打印功能

monitor