论人工智能透明度

高嘉鑫

福建师范大学 350000

摘要：人工智能治理中，透明度虽为核心议题，却存在界定模糊问题——政策文件表述含糊、学术领域使用随意，法学界亦未形成共识，削弱其交流与实践效用。本文先追溯 “透明度”从物理属性到隐喻含义的演变，明确其信息披露与问责关联的本质。继而聚焦人工智能透明度，构建“对谁透明、透明内容、透明方式”三要素分析框架，指出需针对内部 / 外部利益相关者差异化需求，披露技术、价值嵌入、合规影响三类信息，并采用分层沟通方式。最后辨析透明度与可解释性、可理解性的差异，明确透明度以人为中心、含价值导向的内涵，为人工智能治理提供概念基础。

关键词：人工智能；透明度；可解释性；可理解性

引言

鉴于人工智能在社会不同领域的广泛部署且关涉重大利益，为防范风险以确保人工智能向着造福人类的方向发展，透明度成为人工智能治理的核心议题设定。2019 年 4 月，我国发布了《新一代人工智能治理原则——发展负责任的人工智能》、《新一代人工智能伦理规范》，从伦理层面提出了人工智能治理框架，透明度要求也体现于其中。但遗憾的是，相关政策文件中对于透明度的界定并不清晰，且在不同地区的文件中，透明度与诸如可解释性、可理解性等相关概念的关系也存在不同理解。可见的结果就是，该用语在政策中的含糊表述以及学术辩论中的随意使用。法学界关于透明度已经形成了诸多探讨，但并未形成共识性意见。甚至对于概念的任意解读还使其外延被无限延申，削弱了这一概念以有效方式进行交流的能力，甚至使得透明度于实践中的实际效用受到质疑。因此有必要在人工智能治理的语境下界定透明度的概念意涵。

一、从物理属性到隐喻

就“透明度（transparency）“的字面含义而言，它描述了一种物理属性，即物体让光线穿过的能力，观察者因此可以看到物体后面的事物。如玻璃具有透明的属性，光线可以从中穿过，这使我们可以清楚的看到放在玻璃之后的物体。因此，以透明为媒介，外部观察者与被观察对象之间不存在有形障碍，信息得以以初始面貌完整传递。

“透明度”这一用语有时仍以其字面含义来描述物体的物理属性，但除此之外，我们更多以一种其他的方式使用这一概念，而这些方式主要是建立在它作为隐喻的含义之上的。按照学者 Ida Koivisto 的观点，透明度隐喻的认知根基在于“理解即看见（understanding is seeing）“的概念隐喻，在治理、权力等抽象语境之中，它被隐喻性地用于描述 “信息可及性”，即通过某种机制让原本隐蔽的事物变得可知。这一隐喻将视觉感知与理解建立关联，当我们说“看透”某一现象时，本质上是指通过信息获取达到了对事物的理解。从物理属性延伸至抽象领域，透明度被赋予“使被遮蔽的权力、信息、决策过程等变得可见，进而可被控制”的意义。这种隐喻性使用，使得透明度已经成为一个规范性概念，与具有积极效价的概念相关联。当我们提及透明度时，蕴含着“透明度是好的”、“透明度创造合法性”等预设前提。随着时间的推移，透明度的概念也不断演变并逐渐细致。

尽管透明度的定义在不同语境和学科中可能有所不同，但一个共同的关注点在于信息强势主体向信息弱势群体披露相关信息以服务于某种更高的价值或目的，即都强调信息的可及性与公开性，且常与问责相关联。这些对于透明度意涵的基础性解读为探索人工智能透明度的概念框架提供了有益参考。

二、人工智能透明度的关键要素

透明度的有效性受到多种因素和环境的影响，其应当被视为一个以人为中心的技术沟通，涉及不同的利益相关者。从根本上讲，透明度意味着如何提高信息的可获取性，并以一种能够让接收者根据自身特定需求解读并利用信息的方式呈现。这显然要求透明度相关规范的设计应当确定其所欲传达的内容以及向不同利益相关者传达这些内容的最适合的方式。在理解人工智能系统的透明度时，无论至于何种语境之下，都必须考量以下三个关键要素：系统应当面向谁透明；哪些信息应当实现透明；如何面向不同的信息接收者传递这些信息。以上三要素相互关联，构成人工智能透明度解释的基础性框架。

1.对谁实现透明

人工智能系统从开发到部署通常涉及到不同的利益相关者，且不同主体对于透明度有着不同的需求和期望。根据 ISO/IEC 22989 中的定义，人工智能系统的利益相关者包括任何能够影响该人工智能系统、受其影响或认为自身受其影响的个人、群体或组织。具体而言包括以下六类主要群体：人工智能提供者（包括平台提供者和产品、服务提供者）、人工智能开发者、人工智能消费者（包括终端用户以及为终端用户提供产品或服务的组织）、人工智能合作伙伴、人工智能主体（受人工智能系统影响的组织或个人，包括数据主体以及其他主体）、相关机构（如政策制定者、监管机构）。[1]

概括而言，可以将利益相关者大致分为两个基本类别：内部利益相关者和外部利益相关者。内部利益相关者包括直接参与人工智能系统生命周期（从设计、开发到部署和监控）的组织、团体或个人。这些利益相关者有能力直接影响人工智能系统的性能、行为和运行参数。相比之下，外部利益相关者是受人工智能系统影响或与之交互，但无法直接访问或控制系统内部运作的实体。此种区分对于理解不同利益相关者的信息需求、对于系统的潜在影响力以及所需要的不同访问程度而言，至关重要。

2.哪些内容应当透明

虽然本研究的研究焦点在于透明度，但其存在一个不容忽视的限制性因素面——人工智能，作为多要素耦合的系统概念，其涵盖数据、算法、内容输出等多层级结构。过往法学界对于透明度的探讨多局限于算法维度，如有学者指出算法透明意味着公开源代码在内的算法要素[2]；还有学者认为算法透明在于披露代码、参数等算法要素，以及对于算法运行结果的阐释。[3]然而，生成式人工智能的概念边界较单一算法更为模糊且外延更广。且此种针对算法要素的信息披露是否与企业商业秘密等利益相冲突在所不论，在生成式人工智能的语境之下是否有用不无疑问。首先，生成模型本身具有黑盒属性，目前尚未有完整的技术方案对其进行全局解释，披露的有效性存疑；其次，具体的算法和代码的确有可能因故意设计而产生歧视性输出，但在生成式人工智能的语境之下，真正的挑战在于数据与算法的结合，即机器学习过程中海量训练数据与动辄上亿参数的神经网络模型结合呈现出的涌现性，若透明度所指向的对象仅包括算法，显然无法有效识别潜在风险。这意味着透明度必须要考虑机器学习算法、底层训练数据、预期功能以及实际做出决策的语境。

欧洲议会未来与科学技术小组2019年发布《算法问责与透明度治理框架》，其中系统探讨了透明度问题，指出对算法透明度的需求可能涉及不同方面，这取决于系统的类型、用途以及所要求的具体方面。在基于机器学习的算法系统中可能有七大领域需要实现透明，其中仅一项涉及算法本身你，其余六项涵盖数据、系统目标、系统的部署状态、合规信息、影响评估以及使用方法。根据 ISO/IEC 22989：2022 对于人工智能透明度的界定，可能需要向利益相关者传递该系统的相关信息包括目标、已知局限性、定义、设计选择、假设条件、功能特性、模型、算法、训练方法以及质量保证流程等；此外，人工智能系统的透明度还可能要求向利益相关者告知系统开发所使用数据的详细信息（例如数据类型、采集地点、采集时间、采集原因以及使用方式），同时说明个人数据的保护措施、系统的用途以及系统的构建与部署方式；透明度还可包括向利益相关者告知制定相关决策所采用的处理过程及自动化程度。[4]其中不仅仅涉及人工智能系统中的特定技术层面，也涉及系统整体的特质，以及将人工智能技术应用于人类社会系统中时人机交互所应当考虑的其他信息。

总体而言，应当向利益相关者披露的信息可大体分为三类。其一，技术层面的系统客观信息。这一方面涵盖算法逻辑、原始数据集、特征工程方法、模型训练机制等技术要素，其核心价值在于为理解系统运行机理、实现人类对智能系统的有效控制提供基础支撑——唯有明晰这些客观信息，方能追溯系统决策的技术路径，进而确保技术的人类可控性。其二，人工智能系统设计与训练环节的价值嵌入信息。这一方面聚焦系统开发过程中隐含的人类价值偏向，包括训练数据的来源选择、预处理规则（如特征筛选标准）、系统预设目标及多目标间的优先级排序等。这类信息的透明化，是识别系统潜在人为偏见、保障公平性的关键。其三，部署与应用阶段的全链条合规及影响信息。这既要求开发者与部署者对其遵守外部透明度要求的整体情况保持公开（如合规报告、审计结果），也需披露系统的具体使用方式、潜在风险（如决策误差范围、数据安全隐患）及风险缓释措施。其核心意义在于增进下游用户与社会公众对于人工智能系统的信任，同时为监管机构的问责审查提供依据。

3.以何种方式实现透明

人工智能透明度的实现方式，应当以利益相关者的差异化需求为导向，针对不同主体采用不同的信息披露路径与表达方式。由于人工智能系统涉及开发者、使用者、监管者及公众等多方，不同主体在专业背景、信息需求与理解能力上存在显著差异，因此透明度不能是单一的“信息公开”，而应是有层次、有针对性的沟通。

三、透明度与相关概念的辨析

1.可解释性（Explainability）

人工智能，尤其作为其分支的深度学习的兴起，引发了人们对于“黑盒”（black box）问题的担忧。为此，计算机科学领域的研究者将目光聚焦于如何通过可解释性技术揭露人工智能智能的客观结构，即可解释性人工智能（XAI）的研发。所谓“可解释性”，是指“向人类解释或以易懂的术语呈现的能力”，这一定义隐含了这样一个假设——构成解释的、用可理解术语表达的概念是自身完备的，无需进一步阐释。本质上，解释是连接人类与决策者的"接口"，它必须同时满足两个核心要求：既是决策者的精确代理，又能被人类充分理解。” 就此而言，可解释性与人机间的互动关系、价值判断无涉，其指向的对象为人工智能技术，是技术自身的一种属性，即人工智能自身的技术逻辑能否转译为自然语言进而为人类所理解；为了实现此目的，技术研究者开发了一系列可解释性方法，以揭露技术的客观结构。

但透明度显然是一个价值色彩浓厚的概念，属于人机之间的关系范畴，强调如何通过信息披露以实现不同主体对于技术应用的理解，进而有效控制人工智能的潜在风险。因此，透明度与可解释性并不相同，属于两个相互独立的概念。笔者认为，原则上，法律不应当就可解释性做出强制性规定，以防止限制技术的发展与应用。在我国《互联网信息服务算法推荐管理规定》第 12 条，虽然提及算法推荐服务者的“可解释性义务”，但从使用的“鼓励”、“优化”等词语，以及并未规定违反该条款的不利法律后果可以看出，此处对于可解释性的规定更多是一种倡议或指引，并无实际法律约束力。

2.可理解性（Interpretability）

在生成式人工智能法律规制的领域中，可理解性作为透明度核心维度，其内涵需要置于法学与计算机科学的交叉视域下重新理解。相较于计算机科学领域中侧重于技术客观结构还原的“可解释性”，法学语境下的可理解性更加强调信息披露的有效性，即通过符合信息接收者认知能力的手段或方式，实现信息的有效传导。

在透明度与可解释性的关系上，两者存在共性与差异。两者在所欲实现的目标上存在共性，即均以实现可信赖人工智能或建构人工智能的社会信任机制为价值皈依，通过信息披露消解技术权力的正当性危机。但透明度更强调信息披露这一客观状态，而可理解性则强调信息披露的方式，在披露方式上实现从技术代码到可理解的自然语言的转译，在认知上实现从信息堆砌到意义建构的转化。具体而言，可理解性构成透明度的实质化要求。当生成式人工智能系统的信息披露对象为普通用户或社会公众时，若仅满足公开模型参数甚至代码开源等形式性要求，专业信息的过量供给反而会强化认知鸿沟。或者信息强势主体基于自身利益考量，可能会对信息披露进行“模糊处理”。因此，可理解性应当成为透明度的当然要求。

结语

本文阐述了人工智能治理语境下的透明度概念，分析了透明度的对象、内容以及方式这三个关键要素，建立起人工智能透明度的分析框架，并区分了透明度与可解释性、可理解性的概念边界。未来，基于此概念框架的透明度实践，可进一步弥合技术与社会的认知鸿沟，推动人工智能在可控、可信的轨道上发展，最终实现 “负责任人工智能” 的治理目标。

参考文献

[1]ISO/IEC 22989:2022,Information technology—artificial intelligence— artificial intelligence concepts and terminology.

[2]沈伟伟.算法透明原则的迷思——算法规制理论的批判[J].环球法律评论,2019,41(06):20-39.

[3]衣俊霖.数字孪生时代的法律与问责——通过技术标准透视算法黑箱[J].东方法学,2021,(04):77-92.

[4]ISO/IEC 22989:2022,Information technology—artificial intelligence— artificial intelligence concepts and terminology.

作者简介：高嘉鑫（ 1999- ），男，汉族，山西省长治市，硕士研究生。主要研究方向：宪法学与行政法学。

*本文暂不支持打印功能