公益诉讼检察监督因其跨域性、专业性与证据海量化等特征,对案件办理的时效性、准确性与系统性提出了更高要求。适应新时代背景下践行高质效办好每一个案件、“努力让人民群众在每一个司法案件中感受到公平正义”的检察履职办案基本价值追求,传统的依赖人工筛查和线下协同的办案模式亟须升级。笔者认为,可从理论建构与实践路径两个维度优化,形成“全域融合—智能赋能—协同共享”的公益诉讼数据库系统性建设路径,推动公益诉讼检察监督实现从“个案纠错”向“系统治理”的转型,进一步提升公益诉讼在治理现代化中的功能定位与实践效能。
实践样本与模式分析。当前,各地检察机关以数字信息技术为助力,打造上下级检察机关之间信息、人员、资源等办案要素和数据有效整合和高效利用的公益诉讼数据库,按照现有建设模式功能划分,主要有以下三类:
数据整合型模式:检察机关通过建立公益诉讼指挥中心,系统接入检察工作网、12345政务服务热线、政务数据管理局等二十余类内部与外部数据源。内部应用系统中的案件数据,自侦查机关提请审查逮捕之日起即同步至公益诉讼数据库,实现公益诉讼检察官依法介入,刑事、公益诉讼同步审查。针对外部投诉举报类数据,设计“二次投诉举报”“办理结果不满意”等筛选规则,采取“T+1”同步推送机制,提升监督线索转化率。该模式强调整合多源异构数据,提高线索发现和立案转化的效率,体现数据聚合在提升司法办案效能方面的基础作用。
技术赋能型模式:检察机关开发出检察数智平台,内置各类监督模型,引入卫星遥感监测与光学字符识别技术,实现对文书与非结构化数据的知识抽取与自动化分析。该平台通过整合卫星影像数据,利用卫星遥感对影像历史数据进行比对发现线索,在生态环境与资源保护领域赋能监督效果明显。
智能推送型模式:检察机关构建“线索—法条—案例”智能推送系统,整合行政执法信息、网络舆情、鉴定评估报告等各类数据,根据线索具体情况,结合所涉及领域特点,合理确定损失数额、社会影响、涉案范围、监督层级、紧急程度等连接点,并综合线索真实与否、调查取证难度、办案风险大小,进行分类定级,按照重大程度由高到低划分为一级、二级、三级线索,体现出数据智能在提升司法精准性与办案效率方面的优势。
以上三类模式均通过数据聚合与智能工具应用提升公益诉讼检察监督质效,但也暴露出跨部门数据共享存在难度、系统间数据穿透能力不足、业务标准不统一等体制性与技术性短板,制约了数据库综合效能的进一步释放。
公益诉讼数据库建设面临的主要问题。一是数据壁垒问题。由于跨部门、跨区域的政务数据接口未实现统一规范,加之部分数据涉及个人隐私、商业秘密或行政执法敏感信息,数据生产主体普遍存在“不敢共享、不愿共享”的顾虑,导致检察机关难以有效获取外部数据资源。数据来源单一和储备不足,直接影响公益诉讼案件线索的全面性和监督的精准性,尤其在大规模、跨区域公益诉讼中,其短板尤为凸显。二是智能应用支持能力不足。有的公益诉讼数据库处于“重存储、轻分析”的初级阶段,尚未实现从数据管理向知识服务的跃升。三是跨域监督受阻。在流域污染、大规模消费侵权等公益诉讼案件中,各地执法与司法标准不统一,容易导致“同案不同办”的现象。一定程度存在的地方保护进一步加剧了跨域协作的难度,集中表现为信息共享机制不畅、协同办案动力不足、监督合力难以形成。
公益诉讼数据库的优化路径设计。公益诉讼数据库作为可信数据空间,其应用已从单纯的信息存储向深度赋能司法决策演进,尤其在案件线索筛查、法律适用研判、证据链构建、量刑建议生成及社会治理风险预警等场景中,展现出显著的实践价值。公益诉讼数据库的建设与应用,远非单纯的技术升级或工具迭代,而应以数据要素为核心,以智能技术为支撑,以协同共享为机制,从底层逻辑上重构公益诉讼检察的监督模式与实践范式,推动实现从“治已病”向“治未病”、从“碎片化”向“系统化”、从“属地化”向“协同化”的跨越式发展。
构建全域融合的数据治理体系。一是统一数据采集与共享标准。探索系统制定并推广公益诉讼数据分类分级标准,明确数据定义、格式规范与共享规则。每类数据需设定统一编码规则,以支持跨系统识别与交互。同时,可探索建立跨区域数据接口标准和安全传输协议,并实施分级共享机制。基础数据可以开放实时查询,敏感数据经一定层级以上审批后定向共享,从制度与技术两个维度破除数据孤岛。二是创新数据获取与隐私保护机制。探索引入联邦学习等隐私计算技术,以实现“数据不出域、价值可流动”的新型共享机制。参与方,如市场监管、税务、环保部门等行政机关无须直接交换原始数据,而是通过加密信道传递模型参数,与检察机关共同训练风险预警与线索识别模型,实现对高危主体的协同画像与联合监管,既保障数据安全与个人隐私,又充分发挥了数据要素的协同价值。
强化智能技术全链条赋能。一是开发类案推荐与预测功能。依托自然语言处理与机器学习技术,针对公益诉讼同类案件的裁判标准、证据采纳规则及法律适用逻辑,开发类案推荐算法,构建类案推荐系统嵌入公益诉讼数据库。通过对案情特征、法律适用、证据规则等多维度的相似性计算,为检察官提供精准的案例参照和法律适用建议,有效减少检索时间与主观偏差,提升办案一致性与效率。二是构建动态知识图谱系统。探索建立以“行为—责任—救济”为主线的公益诉讼知识图谱,融合法律条文、司法解释、典型案例及行政执法数据,形成结构化、可推理的法律知识库,且支持自动识别上位法与下位法、新法与旧法之间的适用冲突。知识库实时更新与语义关联,能够在案件办理过程中动态提示证据链缺口、推荐调查方向,并为裁判结果预测与风险研判提供支持。三是嵌入深度语义理解模型。借助深度语义模型实现多模态数据融合与非结构化文本的结构化提取,提升对起诉书、检察建议等法律文书的实体识别与关键信息抽取精度。通过实体消歧与关联挖掘,打通检察业务系统与外部执法数据库,强化数据互联互通能力。进一步,可基于案情语义、法律罪名、情节要素、时空特征等实现类案匹配度评估、证据链完整性审查及监督风险预警,全面增强检察监督的精准性与主动性。
健全协同共享的运行机制。一是推动建立跨域数据共享联盟。检察机关与行政机关可以共同制定数据开放目录与使用权限管理规定,构建跨区域、跨层级的公益诉讼检察监督数据共享联盟。共建类案裁判规则库,提炼典型性、指导性案例的裁判要旨,促进法律适用统一。二是完善数据质量考核与激励机制。将数据录入质量纳入激励机制体系,设定“必填字段完整率”“证据材料上传率”等量化数据,激励办案数据规范录入。同时,鼓励检察官在案件办结后提交“办案难点分析”“法律适用创新点”等结构化经验总结,推动知识沉淀与共享,形成“办案即生产数据、数据反哺办案”的良性循环。
公益诉讼数据库的建设既是技术应用升级的过程,更是司法理念与监督机制深刻变革的反映。以数据要素为核心驱动,以人工智能技术为赋能支撑,以协同共享为制度保障,公益诉讼检察正在实现从被动纠错向主动预防、从个案办理向系统治理、从属地管辖向跨域协作的范式转型。未来,可以持续深化数据治理、智能工具与制度创新三者的良性互动,推动公益诉讼数据库在提升办案质效、拓展监督维度、增强治理能力等方面发挥更大作用,为构建法治中国和数字时代司法现代化提供坚实基础与强大引擎。
(作者单位:广东省广州市人民检察院)