壶兰推荐||李洪涛、陈金帅：刑事审判中算法证据的“黑箱”困境与审查规则构建——以生成式人工智能输出结果的司法认定为视角

微信图片_20170424114314

刑事审判中算法证据的“黑箱”困境与审查规则构建——以生成式人工智能输出结果的司法认定为视角

摘要：生成式人工智能的大幅发展，造成算法输出结果正以证据形式进入刑事法庭，生成式AI运行机制呈现典型“技术黑箱”特征——算法逻辑不透明、模型迭代频繁、输出结果概率化，对传统证据审查体系造成结构性冲击。借助对“数据大”向“大数据”范式转变的理论研究，可以了解到算法证据对证据“三性”的冲击不是量变而是质变：就真实性层面来说，从“载体真实”走入“系统可信”范畴；在关联性层面，从“事实关联”走向“概率可校验”；在合法性层面，从“程序合规”走向“过程透明”。立足于人民法院刑事审判实际，借鉴上海等地检察机关探索经验，笔者认为应当搭建起“类型识别—分层审查—权利保障”三位一体审查规则体系：区分感知增强型、分析推理性、内容生成型三类算法证据，确定差异化的准入标准；基于数据可靠性、算法可靠性、输出可校验性搭建真实性审查的三阶框架；利用专家辅助人制度跟技术调查官机制弥补司法认知鸿沟，维护被告人质证权利。只有把算法“黑箱”转化为司法可审查的“灰箱”，才可以于技术赋能和程序正义之间达成动态平衡。

关键词：算法证据；生成式人工智能；技术黑箱；证据审查

引言方法

在数字技术跟刑事司法深度融合的时代背景当中，一种新型证据形式正不知不觉进入法庭，人脸识别系统自动做出的身份比对报告，成为锁定犯罪嫌疑人的重要线索；AI资金穿透工具所画的涉案账户资金流向图谱，为经济犯罪证明起到支撑作用；生成式人工智能给出的对话摘要、合成图像资料，甚至直接作为对被告人“明知”或“共谋”进行指控的依据。这些算法系统自主或半自主产出的信息，正重塑刑事证明里事实发现的方式。

然而，技术迅猛发展，没有同步带来规则的及时更新，生成式人工智能的运行机制呈现出典型“技术黑箱”的特性——算法逻辑不透明、模型迭代频繁、输出结果以概率形式呈现，使传统证据审查机制面临严峻的挑战。当控方递交一份AI所生成的资金分析报告时，法官要怎样判断其真实性？当辩方对人脸识别比对所得结果的准确性存疑时，质证要如何开展？当生成式AI受“幻觉”影响产出的虚构内容被作为证据，谁来负这个责任？这些问题并非只做理论上的推导，而是越来越近的司法实际情况。

2025年，上海市徐汇区人民检察院与公安机关联合发布《生成式人工智能刑事案件电子数据取证与审查指引》，首次对生成式人工智能犯罪领域系统打造取证与审查规范，明确提出采用变量对比、环境模拟、同一性校验等实验途径还原数据生成路径。此地探索表明司法机关开始直面算法证据审查方面的难题。与此同时，学界研究也逐步深入：有学者提出从“数据大”到“大数据”产生了范式跃迁，指出电子数据取证从“静态复原”到“动态认知”的认识论上的转型；有学者把人工智能证据划成感知增强型、分析推理性、内容生成型三类，且就其可采性出现的困境开展系统研究；还有学者关注算法证据可靠性方面的要素，提出以数据可靠性和算法可靠性两个维度来构建审查标准。

本文在上述已开展的研究基础上，以生成式人工智能输出结果司法认定作视角，着眼算法证据“黑箱”问题的解决之道，以对证据“三性”结构性冲击的深入解析为途径，吸收域外“真实是一个光谱”的认知理念，以人民法院刑事审判实际为出发点，尝试架构“类型识别—分层审查—权利保障”三位一体的审查规则体系，以期为智能时代的刑事证据审查提供可操作的裁判指引。

一、算法证据的生成逻辑与类型谱系方法

（一）从“工具”到“主体”：算法角色的认识论转变

理解算法证据的审查难题，首先要确定算法在证据生成当中的角色定位，传统技术手段于证据形成过程中起“工具”作用——照相机客观记录现场，录音设备不掺假地采集声音，鉴定仪器根据预设程序输出检测的结果。在这些场景下，技术只是人类感官的延伸，证据内容最终可追溯至人的观察、操作或判断。

然而，生成式人工智能的出现改变了这一格局。以大语言模型、扩散模型所代表的生成式AI，不再是被动开展预设指令执行的工具，而是有着“自主化”输出的功能，它们在海量数据训练的基础之上，以算法模型“理解”输入的指令内容，产出崭新的文本、图像、音频内容。该过程的主要要点在于：输出结果不是简单地调取、重组既有数据，而是算法以概率分布为基础“创造”的新信息，这种“创造性”造成了证据法相关意义上的深刻变革，传统电子数据审查围绕“原始载体—复制件”的同一性开展相关工作，借助哈希校验、完整性校验等技术手段使数据未被篡改。但生成式AI所产生的输出内容，根本就没有所谓“原始版本”——每次输入一样的指令，算法有可能生成不一样的结果；在模型迭代之后，同一输入所产生的输出也可能有变化，证据的“真实性”不再寄附于某个固定的载体，而得转向对生成过程开展整体评价。

有学者将这一转变概括为从“数据大”（Large Data）向“大数据”（Big Data）的范式跃迁：前者描述的是证据数量的扩张，仍遵循“静态复原”的逻辑；后者则指向跨平台数据流和算法驱动分析，证据结论呈概率性模式识别，其实质是不同类型的事实构成方式。这一区分极具洞察力——算法证据带来的不是证据数量的增加，而是证据生成逻辑的根本改变。

（二）算法证据的类型化构造方法

面对形态各异的算法输出结果，类型化是构建审查规则的前提。结合现有研究成果，可将刑事司法中可能出现的算法证据划分为三种理想类型：

1.感知增强型证据。此类证据以智能传感设备为凭借，经由AI算法对原始感知数据开展识别、标注或结构化加工，常见的样式有：人脸识别系统自动生成的身份比对报告、智能交通监控系统产生的车辆轨迹分析图表、无人机搭载AI视觉模块识别出来的现场异常行为标记等。感知增强型证据的主要特征是“人机协作”——设备获取原始数据，算法对数据开展筛选、标识或比对的事，最终产出人类能领会的结论，其审查关注的重点是算法的识别准确率、误报率和训练数据代表性，人脸识别算法的精确性在不同种族、年龄群体当中可能有显著不同，要是训练数据缺少多样性，输出结果也许包含系统性偏差。

2.分析推理性证据。这类证据凭借对大量数据做建模分析，厘定具有解释性或预测性的结论，具有代表性的形态有：在经济犯罪相关案件里，利用AI资金穿透工具做出的涉案账户资金流向图谱（见图一）；在毒品犯罪侦查工作里，通过通信大数据构建起的社交关系网络图；又如风险评估模型评定出的被告人再犯可能性评分。分析推理性证据的核心特点是“数据驱动”——其结论并非从对特定事实的直接观测而来，而是基于大规模数据做的统计分析，这使得它跟待证事实的逻辑纽带往往间接又不牢固，资金流向图谱能显示账户彼此的交易关系，但没法直接证明交易背后的主观想法；风险评估模型所得到的再犯概率，更不可替代法官对个案详细情节的裁量。

图一：涉案账户资金流向图谱方法

3.内容生成型证据。这类证据以生成式人工智能为代表样式，AI凭借输入指令生成文本、语音、图像还有视频内容，常见形态有：智能语音助手记录并誊写的嫌疑人对话摘要、AI根据案情描述模拟编排的作案过程动画、大语言模型辅助撰写的法律意见书或证人陈述初稿。内容生成型证据是“算法黑箱”特征十分突出、审查难度十分大的一类，生成式AI的“幻觉”现象，也就是产出看似合理却为虚构的内容，对证据真实性有根本威胁，AI利用碎片化信息做出的“对话摘要”，也许会混入大量模型无端“捏造”的内容；AI所模拟的“作案过程动画”，从本质上看，是对案情“再创造”，并非“再现”，此类证据要是不严格约束就直接进入法庭，会极大削弱证据裁判原则的基础。

（三）生成式AI的“黑箱”特质及其证据法意蕴

在上述三类证据中，内容生成型证据最集中地体现了算法证据的审查难题。生成式AI的“黑箱”特质可从三个层面理解：

其一，算法逻辑的不透明性。现代深度学习模型一般会有数十亿乃至数千亿参数，就算是开发者，也没办法把它内部的运作机制完全弄懂，模型如何从输入达成输出，中间经历了怎样的推理过程路径，一般无法给出清晰的解读，这种“可解释性”的未具备，造成传统证据审查里“为什么会这样认定”的追问难以进行。

其二，输出结果的概率性。生成式AI输出从本质上来说是基于概率分布的最大似然估计，这说明同一个输入在不同时刻、不同的设置下，或许会有不同的输出结果，“真实”不再作为确定的状态，而是一个概率所涵盖的区间，有海外的学者敏锐地道出，AI时代当中“真实存在于光谱上”，传统证据审查的二元逻辑（真实/虚假）正被光谱逻辑（在多大程度上是真实的）所替换。

其三，生成过程的可干预性。算法的训练数据、模型的各项参数、提示词的相关设置等因素，都有对输出结果产生影响的可能，在这些因素相关的方面中，有些是技术相关的客观局限，有些说不定蕴含设计者的主观意愿，怎样识别并管控这些干预因素，给证据合法性审查提出更新的要求。

正是上述所具有的特质，造成算法证据对传统证据审查体系产生系统性冲击，正如有学者讲道，算法证据司法适用面临三层风险：对无罪推定与自由心证产生冲击；“概率近似正确”理论下事实认定有错误或歧视现象；权力行使有隐化和异化的态势，这些风险并非基于理论做的推演，而是已经或马上要在法庭上出现的现实状况。

二、“黑箱”困境：算法证据对传统证据三性的结构性冲击

（一）真实性的危机：从“载体真实”到“系统可信”

传统电子数据真实性审查围绕“原始载体”开展相关工作，《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》明确要求，审查电子数据真实性，要着重审查电子数据是否随原始存储介质予以移送、原始存储介质的封存状态是否处于完好状态、收集提取过程是否能够重现出来等。这一制度设计的核心逻辑是“载体同一性”——只要可以证明当前审查的数据与原始存储介质中的比特序列一模一样，真实性就可以确立。

算法证据的出现使这一逻辑面临根本性质疑。以生成式AI生成的内容来举例：首先，不存在有可封存的“原始载体”，AI生成的内容存于服务器端和云端二者其一，当事人一般可获取到的只是最终输出结果，而不是生成过程的全量记录内容；其次，“哈希校验”不再有意义，哈希值意在验证数据没有被篡改，但AI生成的内容本就没有所谓的“原始版本”，相同输入的不同输出都可以生成不一样的哈希值，校验根本没法开展；最后，取证对象由“静态介质”转向“动态系统”，AI模型持续进行迭代、训练数据不断更新，取证时所碰到的已不是某个固定时刻的“快照”，而是一个不停变化的动态系统。

因此，算法证据的真实性审查要完成从“载体真实”到“系统可信”的范式变更，审查所关注的不再是“这份证据和原始版本是否一致”，而是“这个生成系统是否足够可靠”——囊括训练数据的代表性、算法模型的有效性、生成过程的稳定性、输出结果的可校验性等多个范畴，真实性已不再是二元判断，而是一项程度审定。

（二）关联性的难题：从“事实关联”到“概率可校验”

关联性审查是为了判断证据材料跟待证事实之间有无逻辑联系，传统证据关联性相对是比较直观的：凶器上指纹和被告人之间的关系，可经比对来完成确定；案发地的监控录像跟作案行为的联系，能够经观看建立起来，法官凭借经验法则就可以完成关联性的初步甄别。

算法证据的关联性则呈现完全不同的面貌。以AI资金穿透工具所产出的资金流向图谱为例：此图谱展示了数十个账户之间所产生的数百笔交易，同时用不一样的颜色标识出“可疑交易路径”，此图谱和被告人洗钱行为所具有的关联性，并非直接从图谱当中呈现，而是依靠着算法对“可疑”的判断标准、对交易数据的筛选原则、对路径识别的算法思路。法官所看到的只是最终的可视化结果而已，而不是算法得出结论的执行过程。

这种“过程不可知”使得关联性审查陷入困境。从证据法相关的法理来讲，关联性包含着两个维度内容：一是“相关性”（relevance），即证据是否使待证事实更可能或更不可能；二是“证明力”（weight），也就是证据对证明待证事实能起到多大作用。传统审查中，二者虽作区分又彼此支持——理解了证据是什么，也就大致能判断其能证明什么。但算法证据的“黑箱”特质使得这两个层面发生断裂：法官能够看到“证据是什么”（输出结果），却难以判断“这能证明什么”（输出与待证事实的逻辑联系）。

破解这一难题的出路在于“概率可校验”。算法证据的关联性不应只停留在结论的这一层面，而应拓展至结论产生的全进程。需促使算法提供方把情况说明：输入数据跟待证事实的关联逻辑走向、算法模型识别相关模式的理论依据、输出结果置信区间的计算基本方法。只有使产生概率性结论的过程接受校验，法官才能就算法证据和待证事实的关联程度形成合理的判断。

（三）合法性的模糊：从“程序合规”到“过程透明”

合法性审查关注取证程序是否合法合规：搜查有无证件、扣押有无制作清单、鉴定是否由有资质主体开展，这些程序要件是比较明确的，检查法律文书的完备程度就可完成。

算法证据的合法性则面临多重模糊地带。第一，取证行为的法律定性模糊。公安机关借助爬虫工具于社交平台批量抓取数据用于算法模型的训练，属于技术侦查一类，还是常规取证？若按技术侦查程序审批方面的要求，实践当中难以做到；若把它作为常规取证用，还或许规避掉技术侦查的严格程序控制。第二，算法训练数据的合法性存疑。为人脸识别算法训练所使用的图像数据，有无取得被采集者同意？是否包含没有脱敏处理的个人信息？要是训练数据本身的来源不合法，基于它所生成的证据是否应当排除？第三，算法设计过程的可规制性不足。算法进行训练时的数据筛选、特征选取、阈值设置等方面，都有潜藏设计者主观倾向的可能，但这些“设计层面的选择”是否算“取证程序”，可不可以纳入合法性审查范围，仍然没有明确的规范。

上海徐汇区《指引》的探索值得关注。其清楚地规定，就生成式人工智能相关的刑事案件来说，需“借助变量对比、环境模拟、同一性校验等实验方式，去还原数据生成路径”，这一规定的内在意义在于：合法性审查不可仅满足于“取证时”的程序符合法规，而应拓展到“生成前”算法设计、“生成中”模型运行、“生成后”数据流转等全流程。算法证据合法性由“程序合规”走向“过程透明”——只有使证据生成的完整环节接受审查，才能对合法性给出准确判断。

三、比较与借鉴：域外经验与中国语境方法

（一）域外司法实践中的算法证据审查方法

域外司法实践同样面临算法证据的审查难题，其探索经验可为我国提供有益镜鉴。

美国判例法中，算法证据的可采性主要依据Frye标准（“普遍接受”原则）和Daubert标准（法官审查职能）进行判断。Daubert标准要求法官去审查专家证言所依据的理论或技术有没有经过检验、有没有经过同行评议、错误率是否可知道、有无在相关领域被普遍认同。此框架为算法证据审查给出基本思路，即关注技术自身的可靠性，而不只是考虑输出结果。

应当关注的是美国近期两起案例相互对比，在亚利桑那州马里科帕县相关的一起案件中，法院批准在量刑程序当中使用AI生成的被害人陈述视频（用AI模拟已故被害人的形象和声音），而在纽约州上诉法庭的一个案子里，法院明确地拒绝用AI生成的代理律师来进行口头辩论。两起案件的主要区别是AI介入的程序阶段：前者用于被害人陈述当中，起到量刑辅助作用，后者在代理辩论这一核心诉讼核心行为方面发挥作用。这给我们提示，对算法证据审查时应区分它所介入的程序环节和影响程度，施行有差异的审查标准。

弗罗里达州的又一起案件更有启示作用。一位法官通过AI驱动的虚拟现实（VR）设备亲自到犯罪现场做证据的审查，支持者提出VR可还原现场、帮助查证事实，反对者害怕AI重构也许有不准确、存偏见甚至重新塑造记忆的可能。该案件反映出核心争议：当技术不再只是起到“记录”现实的作用，而是“再建”现实时，要如何对其证据价值作出适宜评价？有学者认为，“真实现在存在于一个光谱之上，法院需要应对前所未有的真实性渐变”。

（二）本土规范的初步探索方法

我国对算法证据的规范探索正在加速推进。2024年，《最高人民法院关于规范和加强人工智能司法应用的意见》发布，确立“透明可信”“辅助审判”等核心原则，明确要求人工智能司法应用应当保障算法透明度、结果可解释性。这一规范性文件为算法证据审查提供了基本引导。在地方探索层面，上海市徐汇区人民检察院与公安机关联合发布的《生成式人工智能刑事案件电子数据取证与审查指引》最具典型意义。该《指引》共4章42条，针对生成式人工智能刑事案件，分别以技术开发者、服务提供者、技术使用者为主体，明确取证的方式与侧重，而且对侦查实验和技术鉴定提出取证方向。针对“算法黑箱”难以溯及过往的情况，《指引》创造性的提出通过变量对比、环境模拟、同一性校验等实验方法还原数据生成路径。

学界研究同步推进。有的学者认为要构建“三维智能取证证据审查模型”“动态合规取证分级矩阵”和“智能取证能力成熟度评估模型”，为当下电子数据证据审查提供模型化工具体系。有的学者聚焦算法证据的可靠性，提出从数据可靠性和算法可靠性两个维度制定审查标准，并系统构建取证、开示、质证与认证规则。还有的学者聚焦深度伪造证据，提出“制度—技术”协同治理框架，强调分层式审查模式、举证责任转移规则等具体规则完善。上述研究证明，算法证据的审查规则正在从“能否使用”的普遍性研究，演变成“如何使用”的精细化建构。本文在既有探索基础上，尝试立足刑事审判实际，提出更具可操作性的审查规则框架。

四、审查规则构建：类型识别—分层审查—权利保障

（一）第一阶：类型识别与准入过滤方法

算法证据不是单一的一种形态，各类型证据对审查标准的需求差异十分明显，在证据准入这一环节要建立类型识别机制，依据证据所具有的风险程度和审查难度，采取有差别的准入标准。

其一，感知增强型证据的核心风险跟算法识别的准确性有关，就这类证据而言，应当审查：算法模型有没有经过充分测试，识别准确率是否够上行业标准；训练数据是否拥有代表性，是否囊括不同场景、不同人群；误识率、拒识率这类关键指标是否清楚，是否在可容忍的范围当中。符合上面要求的，能作为辅助方面的证据运用，但不可以单独作为定案的依据。

其二，分析推理性证据的核心风险和推理路径的透明性有关，就这类证据而言，应要求对方提供：算法逻辑的扼要介绍，包括数据筛选办法、模型识别依据、结论产生过程；输入数据完整性方面的说明，涵盖数据的出处、采集的时间、样本的大小；输出结果的置信区间以及误差所在范围，使法官提升评估结论的可靠程度。不能提供上述说明的，应当排除。

其三，内容生成型证据的主要风险是“幻觉”问题和可进行干预性，就这类证据而言，要设置最严格的准入规定：一般来说不能单独作为定案的支撑，需与其他证据相互印证起来；生成过程要把全程记录下来，涵盖输入的指令、模型的版本、生成的时间、输出的内容之类的；对于可能对定罪量刑起到影响的关键内容生成型证据，应做技术验证和鉴定相关工作。对于符合《指引》提出要求的“变量对比、环境模拟、同一性校验”等实验方法验证情形的，可有效提升证据的可信度。

要着重强调的一个点是，类型识别处在动态调整的过程中，伴随着技术的进步，各类证据的风险特点有可能出现变化，审查标准也必须做相应的调整，建议通过指导性案例以及司法解释的样式，及时更新类型识别标准以及准入要求。

（二）第二阶：真实性的分层审查方法

对于经准入审查合格的算法证据，进入开展真实性审查的阶段后。根据现有的研究成果，可从数据可靠性、算法可靠性、输出可校验性三个层次依次审查。

1.第一层：数据可靠性审查。算法证据真不真实首先取决于输入数据可不可靠，审查所涉及的要点为：训练数据的获取是否合法、采集过程是否合规；数据的完整性是否做到保障，是否有选择性采用或人为挑选；数据的时效性是否达到要求，是否和案件发生时刻相匹配上。对于来源不清楚、采集不合法的数据，要降低其可信度，或者把它排除。

2.第二层：算法可靠性审查。算法模型本身的有效性对真实性起到核心保障作用，审查所涉及的要点有：算法设计原理在科学上是否可行，是否经过同行评议以及行业认可；算法的测试验证是否到位，错误率、准确率等关键指标是否清楚明确；是否对算法的版本迭代做记录，是否有会使输出结果受重大影响的修改。要是算法逻辑呈现不透明、无法提供可靠性证明的，要对它的证明力加以限制。

3.第三层：输出可校验性审查。最终输出结果能不能获独立验证，是真实性查验的关键要点，审查所涉及的要点为：可不可以利用变量对比、环境模拟等手段重现生成过程；输出结果的置信区间和误差范围是否明确无误；是否有其他的技术手段能够对输出结果真实性进行交叉验证。对于没办法校验的算法证据，应将其他证据结合着综合判断，杜绝只凭这一证据定案。

三层审查不可机械地去采用适用，而要按照证据类型和案件形势灵活变动，就风险比较低的证据（如成熟的商业人脸识别系统），可以适度减少审查内容；就风险比较高的证据而言（如生成式AI输出的内容），则要严格按照三层审查标准来采用。

（三）第三阶：证明力的综合评价方法

通过真实性审查后，需对算法证据的证明力进行综合评价。证明力评价应当综合考虑以下因素：

1.技术层面的可靠性。算法模型的成熟度、行业对于它的认可度、错误率所处水平等技术指标，是证明力得以成立的根基，获得权威机构认证、在相关领域大规模应用的算法，其得出的输出结果有较高的证明价值；正处于试验期、没有行业共识的算法，证明力应做相应的降低。

2.印证关系的完整性。算法证据跟其他证据有无形成相互印证的关联，是测定证明力的重要尺度，可跟其他客观证据（像物证、书证）相互印证的算法证据，有着较强的证明作用；仅仅跟言词证据相互印证，或者有着完全孤立状态的算法证据，证明力是应当受到限制的。

3.反证可能性的考量。被告人有无提出反证、反证是否合理，对算法证据证明力评价造成影响。比如，被告人提出人脸识别结果产生错误，并且给出具体的事由情况（如双胞胎出现误判、整容后没更新照片等情况），要求控方进一步解释算法的识别逻辑以及误差范围。算法证据的提供方没作出合理解释的，证明影响相应减小。

4.证明标准的适配。不一样类型的算法证据在证明标准上要有所区分，感知增强型证据可用于对客观事实（如某人在场）进行证明，分析推理性证据可用于证明关联的关系（如资金往来），内容生成型证据对于证明关键构成要件事实并不适宜。就可能对定罪量刑带来影响的算法证据来讲，要适用更为严苛的证明标准。

（四）程序保障：质证权与专家辅助方法

算法证据所具有的技术复杂性，说不定会加剧控辩双方的信息不对称，损害被告人的质证权利，一定要加强程序保障，保证权利救济具有实效性。

1.建立算法证据披露义务。控方或者法院要采纳算法证据的，要提前向辩方给予技术摘要，涉及算法基本原理、训练数据的原始出处、模型测试的各项结果、误差的范围等重要信息。有关商业秘密或国家秘密涉及到，可在进行保密的前提下提供摘要，允许辩护律师在保密的条件里查阅。

2.完善专家辅助人制度。刑事诉讼法第197条所确立的专家辅助人制度，对算法证据审查而言有特殊价值。应当明确的是，专家辅助人有权利查阅和算法证据生成有关的技术资料，参与算法说明所涉及听证，还会就技术上的缺陷提出质疑。就重大复杂的案件而言，可研究设立技术争点整理程序，由合议庭先把算法证据争议焦点确定好。

3.探索技术调查官机制。就算法证据争议较大的案件而言，可引入技术调查官来开展审查，技术调查官作为法院技术方面的专家，可就算法可靠性、数据完整性等技术方面问题发表相关意见，帮助法官形成内心认知。技术调查官的介入，既可弥补法官技术认知的局限，又可避免过度依赖控辩双方的专家对抗。

4.明确举证责任转移规则。借鉴“技术质疑触发举证转移”的思路，当被告人提出合理的质疑，且初步举证来证明算法证据可能有错误时，举证责任转移给控方之后，控方要进一步说明算法的可靠性以及输出结果的准确程度，或者利用实验手段验证生成的过程。没有完成证明责任的，应当给出有利于被告人的认定。

结语

生成式人工智能浪潮正以前所未有的速度席卷社会各个领域，刑事司法也没办法置身事外，算法输出的结果作为证据进入到法院，既可能成为提高司法效率、增进事实查明本领的好工具，也可能由于有技术黑箱存在，削弱证据裁判原则的基础，造成对程序正义底线的威胁。本文核心要表达的立场是：面对算法证据所呈现的“黑箱”困境，不可因出现难题就一概排斥，同样不可任其发展、直接接纳，合理的路径是“将黑箱变成灰箱”——借助类型识别弄明白审查对象，采用分层审查穿透技术所形成的迷雾，运用程序保障弥补认知方面的鸿沟，最终使算法的技术逻辑进入司法证明的规范框架，唯有这样，才可以在技术助力司法和程序保障公平之间达成动态均衡。从更偏向宏观的视角去考量，算法证据审查规则的搭建，和数字时代刑事证据制度的深度转变有关。从“载体真实”到“系统可信”，从“事实关联”到“概率可校验”，从“程序合规”到“过程透明”，这些转变并非对传统证据规则的简单改动，而是一场不声不响的证据法变革，作为这场革命的亲力参与者和亲历者，刑事法官要保持着对技术理性的敬畏感，更要持有对程序正义的信念，不管技术如何转化，司法的最终使命一直不变：在每一个案件当中找出真相、达成正义。

尾注

[1]元轶：《证据制度循环演进视角下大数据证据的程序规制———以神示证据为切入》，载《政法论坛》，2021 年第3期，第134页。

[2]徐汇区人民检察院：《徐汇出台生成式人工智能刑案电子数据取证审查指引，破解AI犯罪“黑箱”取证难题》，https://www.sh.jcy.gov.cn/xhjcx/xwzx/xjxw/129759.jhtml。

[3]李小恺戴士剑：《从“数据大”到“大数据”：电子数据取证及审查的范式嬗变与模型建构》，载《国家检察官学院学报》2026年第1期。

[4]高宇石：《刑事诉讼中人工智能证据的可采性困境与对应》，《人民法院报》2026年1月22日，https://www.chinacourt.cn/article/detail/2026/01/id/9163069.shtml。

[5]潘金贵：《数字时代刑事证据运用的风险及规制—以算法证据为分析视角》，载《法治研究》2024年第6期，第26-42页。

[6]吴洪淇：《刑事证据审查的基本制度结构》，载《中国法学》2017年第6期，第168页。

[7]褚福民：《电子证据真实性的三个层面———以刑事诉讼为例的分析》，载《法学研究》2018年第4期，第135-137页。

[8]谢登科：《电子数据的技术性鉴真》，载《法学研究》2022年第2期，第211-218页。

[9]汪怀君、汝绪华：《人工智能算法歧视及其治理》，载《科学技术哲学研究》2020年第2期，第103页。

[10]卓翔、崔世群：《论人工智能在证据推理中的辅助性定位》，载《治理研究》2023 年第1期。

[11]郑飞：《数字证据及其阶梯式分类审查机制》，载《法学研究》2024 年第5期。

[12]余鹏文：《刑事诉讼中人工智能证据的法律性质和运用规则》，载《中国刑事法杂志》2024 年第5期。

[13]张祥，《美国生成式人工智能证据审查法律规制的镜鉴》，载《证据科学》，2026年第1期，第72-83页。

[14]谢登科、周鸿飞：《司法人工智能在证据审查中的功能定位与风险规制》，载《吉林大学社会科学学报》2024 年第3期。

[15]潘金贵：《数字时代刑事证据运用的风险及规制—以算法证据为分析视角》，载《法治研究》2024年第6期，第26-42页。

[16]潘金贵、杨洪彬，《技术黑相与规则重构：刑事诉讼中深度伪造证据的审查困境及路径选择》，载《辽宁公安司法干部管理学院学报》，2025年第4期，第69-78页。

[17]熊晓彪：《生成式人工智能证据认定的困境与规范进路》，载《法律科学（西北政法大学学报）》2025 年第1期。

[18]张保生、董帅：《中国刑事专家辅助人向专家证人的角色转变》，载《法学研究》2020年第3期，第 161页。

作者简介

李洪涛，临清市人民法院党组成员、刑事审判庭庭长，四级高级法官。

陈金帅，临清市人民法院四级法官助理

来源：中国政法大学刑事辩护研究中心

联系我们：

壶兰·总所
地址：福建省莆田市城厢区东园路三迪国际公馆33层（市政府对面），电话：0594-2261218，邮编：351100
壶兰·广州所
地址：广东省广州市越秀区沿江中路298号江湾新城C座，电话：020-83528340，邮编：510000
壶兰·仙游所
地址：福建省莆田市仙游县鲤城街道紫檀南街锦福家园2号楼315，电话：0594-8260396，邮编：351200
壶兰·秀屿所
地址：莆田市秀屿区笏石镇毓秀路1166号泰安汇景园9#楼，电话：0594-5878885，邮编：351146