也可直接联系我们
方式一 拨打报名热线或邮件咨询:
电话: 010-67046081
邮件: 195024562@qq.com
方式二 填写参会确认表
表单下载: 下载
发邮件至: 195024562@qq.com
或传真至: 010-67046081
为深化政法智能化建设,加强“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”等信息平台建设,深入实施大数据战略,实现科技创新成果同政法工作深度融合。法制日报社已连续举办了六届“政法智能化建设技术装备及成果展”。
作为装备展配套活动,法制日报社于去年3月继续举办了2023政法智能化建设创新案例及论文征集宣传活动,活动征集了“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”创新案例、方案、产品、论文,2023年6月25日结果揭晓发布。入选的各类创新案例、方案、产品、论文在2023年7月10日至11日举办的成果展上进行了集中展示,并已编辑整理成册——《2023政法智能化建设创新案例及论文汇编》。
该汇编分为智慧治理篇、智慧法院篇、智慧检务篇、智慧警务篇、智慧司法篇五个篇章,为政法信息化、智能化建设提供及时、准确、 实用的资讯信息与经验观点。
应广大读者要求,我们特开辟专栏,分别将部分创新案例、创新方案、创新产品、创新论文进行展示,敬请关注!
以下推出的是《智慧检务篇 | 创新论文之“数字检察背景下要素式监督基本问题研究”》
数字检察背景下要素式监督基本问题研究
赵美娜 浙江省嘉兴市人民检察院
【摘要】:在“个案分析——提取特征——分析研判逻辑——确定建模逻辑——建模处理数据——发现线索”的数字检察模式中,模型是大数据法律监督的核心,提取要素是模型构建完善的基础操作,模型分析后输出的相关性线索促成类案办理和系统治理的“要素式监督”模式。通过模型构建、模型迭代和模型拓展三步能够形成规模性的应用方式。模型的成案性、可解释性和可复用性是有效的三个属性,基本分类可以分为犯罪画像、数据挖掘、数据比对、规则耦合和规则循环型,需要四个层面分工合作予以实践优化。目前存在的建模单兵化、监督项目化和优势倾斜化问题,需要采取措施进一步向全面监督、动态监督、均衡监督发展。
【关键词】:数字检察 大数据法律监督 要素
发挥数字技术对法律监督工作的增益作用是人民检察院发展进步的重要方向。近年来,在大数据技术的赋能下,检察机关法律监督模式呈现从个案办理到类案监督再到系统治理的新特征,形成了“个案分析——提取特征——分析研判逻辑——确定建模逻辑——建模处理数据——发现线索”的基本模式。最高人民检察院检察长应勇在全国检察机关贯彻两会精神电视电话会议上强调深化实施数字检察战略,构建“业务主导、数据整合、技术支撑、重在应用”的数字检察工作机制,以数字革命赋能法律监督。数字检察办案模式在浙江、贵州、背景等多地探索建立、开花结果,其中较为明显的特点为依靠数据分析技术的大数据法律监督模式。
数据、算力是监督的基础,决定大数据法律监督能否开展,模型则是大数据法律监督的核心,决定大数据法律监督开展的水平。大数据法律监督模型是指经检察官提取要素或建立关联性分析,通过机器对数量巨大的各类数据信息进行直接分析、比对或将数据信息与法律规定初步耦合,发现相关性线索的思维模式及数据分析步骤。[1]近似原理的有大数据侦查模型、大数据监察模型等。[2]
一、要素的提炼:模型构建完善的基础操作
提取要素进行分析研判逻辑的推理是一种或然性推理,如同侦查逻辑中的合情推理[3],面临的主要困难是如何在纷繁芜杂的表象下发现事务的内在联系,形成一个较完整的有关于被监督事项形成的原因、过程、手段、人员特征的合情推理体系。[4]即提取的特征能否反映被监督事项形成的问题本质,需要通过经验、搜集材料、确定相同属性与不同属性,通过比较、分类、综合等方法提取本质特征。
如冯某某等人诈骗类案监督模型中,犯罪嫌疑人冯某某勾结某财物管理公司员工刘某利用 H 市人才管理服务中心系统的服务便捷性,在网络平台上发布“H 市应届高学历毕业生生活补贴申请”的广告信息,与不符合申领条件的大学生取得联系后,利用身份信息通过代缴社保、制造虚假在 H 市工作证明等手段,为不符合条件的大学生骗领应届高学历毕业生生活补贴,并从中获取高额服务费。类案监督中提取的要素特征为:一是通过网络平台发布公告获得大学生身份信息;二是社保缴纳时长 1 至 2 个月,收到补贴后次月停缴;三是犯罪嫌疑人通过支付宝收取固定金额的服务费;四是付款方式为先支付部分手续费,补贴到账后支付尾款。[5]通过身份信息、资金往来筛选出的可疑人员与社保基金领取人员信息建立数据比对模型,即可输出线索,经人工核查予以立案监督。
二、要素式监督:模型分析相关性的指向
大数据法律监督需要数据准备、明确问题和思路、提取要素、数据挖掘、确定和验证线索等工作,通过构建的模型进行数据分析发现的是相关性线索,这是或然性推理的结果。[6]原因是任何违法犯罪都有一个信息链条,孤立看线条上的每个信息点很难发现异常,运用大数据筛查、比对、碰撞、信息点之间就有了交集、串联,问题线索就能信息展现出来。[7]进而形成了一种从个案办理中提取要素,通过构建模型输出相关性线索,促成类案办理和系统治理的“要素式监督”模式。
三、生命的周期:模型构建完善的具体步骤
模型的构建根据平台的不同而有所不同,但是从模型主体的完善性和使用性角度出发,可以分成三个步骤:1.模型构建;2.模型迭代;3.模型拓展。
在人工建模的情况下,有检察官将模型的构建总结为将文字办案规则落地为机器智力算法的过程,[8]这与深度学习中有监督的学习相同。但在有监督的学习情况下,模型的优化不需要人工完成,而是利用标注的数据不断更新算法模型的参数,逐步优化模型的判断能力,即模型的准确率。[9]模型拓展可以理解为模型的增量开发,重建模不重应用是大数据法律监督实践中的误区之一。[10]前面两个步骤均是单一监督场景的情况下进行的,模型拓展可以是同一专项不同侧重点的模型的横向拓展,也可以是监督场景的纵向深入,如入选浙江省数字法治好应用的“刑法执行同步审查协同应用”和“行刑共治应用”,在应用层面通过模型的拓展形成小型系统,这种形成规模效应的应用模式才是模型的全生命周期应用。
四、“三性”的评估:模型构建完善的标准
以浙江省检察机关大数据法律监督平台模型为例,自2021年12月-2022年4月,平台共有模型1600余个,1100个为测试模型,有效模型为468个,服务于15个数字检察专项监督的166个。刑拘下行、多次行政处罚和“净化空壳公司”占据前三位,分别为46个、35个和17个。根据调查,专项中线索排查率,即核查线索数与线索总数量的比值,最低的为2.39%,最高的为37.86%。成案率即监督成案数与查实线索数的比例,最低的为0.17%,最高的为81.08%。[11]
一个专项可以有多个模型,一是各地检察官根据省院指引自行完成建模;二是一个专项中的模型也各有侧重导致细节不同。如“净化空壳公司”有些侧重公司注销后的行政检察监督,有些侧重于涉税案件未依法立案开展监督,有些侧重空壳公司清理;三是模型在指引基础上迭代升级,如“公安机关多次行政处罚”到“行政机关行政执法类案监督”。
浙江省检察院《数字检察快报》中提到“有效模型”但未明确定义,浙江的模型推广经验可总结为“一地突破,全省推广”,或者是模型有效性的“异地验证”。最高检《关于加快推进数字检察工作的通知》(下称《通知》)中要求最高检和省级院要稳步建设大数据法律监督模型管理平台,汇聚一批“性能成熟、类型多元、可复用、可推广”的模型。
总结而言,模型的成案性、可解释性(可推广性)、可复用性(分析周期性)可称为模型的三个属性。三者是需要综合判断的,法律监督线索也依赖于被监督单位的执法司法问题,不同地域问题可能不一致,某地某个时间段模型应用的成案性可能为零,如果模型具有可解释性,可以周期性复用,在一地没有成案但在其他地域成案的也应认定为模型有效。
五、类型化分析:实践中有效模型的具体分类
大数据法律监督的分类方式有多种,基于数据分析方式予以分类更为合理,要素的提取应结合数据分析的具体方式。如法律人工智能中规则驱动型与数据驱动型两种方式,规则驱动型是要求机器按照规则的逻辑进行判断,数据驱动型要求机器按照“(海量)信息数据输入——程序处理输出”的模型进行判断,[12]结合实践中类似大数据侦查的监督模式——犯罪画像类型,大数据法律监督能够细分为五类:
①犯罪画像模型——通过提取犯罪特点,描摹犯罪人的特征,进而确定具体犯罪人,主要用于检察侦查或刑事立案监督。
②数据挖掘模型——提前设置次数、人名等要素作为敏感词,运用机器的高性能运算,在同一数据库内深层挖掘,程序处理输出与敏感词相关的数据。
③数据比对模型——将两类具有包含或同等关系的数据库输入后进行比对,程序输出匹配的或者未匹配的数据成为新的数据库,主要监督交付执行等需要两个或多个被监督单位衔接配合的事项。
④规则耦合模型——信息与法律规则的直接匹配,“输入成文法规则→输入机器可读性信息→输出匹配或未匹配结果”,该类型中机器直接单次输出结果,以检察监督中的程序性监督类型为主要监督场景。
⑤规则循环模型——即人机混合增强型,如“监管数据分析→任务智能生成→现场联网检查→结果智能反馈”的循环工作模式,[13]通过智能辅助系统、设计相应算法,对被监督单位海量的监管数据(包括程序性与实体性数据)进行挖掘与分析,根据预先输入的监督类型制定对应的检查任务。检察官结合应用制定的检查任务,针对台帐资料进行检查、谈话讯问等,得出检查结果并输入智能辅助系统。每一个单次循环的结果可以构建新的数据库,对不合格检查结果设置偏好算法,进而增加检查次数,通过循环使监管精准度不断提高。
六、“四层面”分工:模型构建完善的实践探索
基于对于实践现状的考察,大数据法律监督模型的构建与完善存在四个层面上的分工:一是四级检察院的分工;二是业务部门与案管部门的分工;三是法律专家与技术专家的分工;四是办案组内员额检察官与助理、书记员的分工。
(一)四级检察院的分工
根据《通知》,明确建立上下一体的模型研发应用。最高检负责研发、总结、推广全国性适用的监督模型、评选和发布数字检察办案指导性案例。最高检和省级院要稳步建设模型管理平台。下级院提炼规则、研发模型,上级院负责模型异地验证、推广。实则,各级院均可研发模型,但市级院、基层院的研发任务更重,高检院、省级院注重模型的验证、推广。市级院和基层院的分工可以更加细化,如基层院立足本地实际提炼要素、构建模型,市级院要积极负责场景创新、不断演化、迭代升级,使监督模型产生叠加裂变效应。[14]这样,四级院皆可以研发模型,又各有侧重的做好模型的统筹、筛选、迭代、增量开发等工作。
(二)业务部门与案管部门的分工
《通知》中对于模型构建要求“强化业务部门在模型研发中的主导责任”。案管部门自然化身统筹或者牵头部门。基于目前的“弱人工智能”背景和“数据业务化”的要求,只有业务部门才具有提炼要素的能力,进而构建模型。但案管部门可以率先试点探索“深度学习”模式下的模型构建、迭代,做好模型的图文呈现与推广工作。
(三)法律专家与技术专家的分工
根据实践,浙江绍兴地区建立了“数字检察办案团队”,其中包含业务部门检察官和技术部门骨干,实现要素提取到模型构建中的语言转化。理论上有人指出,法律业务专家应当致力于将法律性与准法律性的行为规则予以精细化与算法化。技术管理专家则应当按照法律业务专家的要求实现行为数据的可记录与数据行为的可计算。在模型构建的过程中需要法律专家与技术专家的密切配合,具体分工实则需要二者皆能够具备对方知识体系的基本知识。
(四)办案组中检察官与助理、书记员的分工
根据最高检《关于完善人民检察院司法责任制的若干意见》《关于完善检察官权力清单的指导意见》和《司法办案组织设置及运行办法(试行)》的有关规定,检察官实行办案责任制,助理辅助检察官办理案件,书记员承担司法办案过程中的事务性工作和立卷归档工作。办理其他非办案类检察业务,可以参照执行。构建模型属于检察办案前寻找案件线索的业务类型,仍可参照上述规定执行。在有监督学习的深度学习模型中,检察官助理或书记员对采集的大量数据进行初次标注,在初次标注的基础上检察官进行二次标注,两次数据标注的结果作为训练数据对深度学习算法模型进行反馈。[15]在人工建模的层面,由检察官提取要素、构建模型,检察官助理辅助清洗数据、构建模型、分析数据,书记员清洗数据。模型优化中,检察官根据经验拓展、迭代模型,检察官辅助、书记员承担事务性工作。总体而言,检察官发挥更大的经验性、主导性作用。
七、问题与困难:要素式监督的不足及完善
(一)建模单兵化,非全面监督
前文中五类模型的构建更多基于业务部门检察官个人或检察官与技术人员组成专班的能力,监督的项目呈点状。如浙江省人民检察院开发大数据法律监督平台后,与各地的大数据监督软件并行不悖,一定程度上可以加强省级院的统筹作用,强化对模型构建的集约化使用、推广。同时,该平台的模型构建场域提供脚本算子和模型算子,同时提供算子手册,脚本算子供拥有编程能力的检察人员使用,模型算子可以直接使用。建模对于单个人员的依赖短期并不突出,因为实践已经积累了一定数量的模型,在“一域突破、全省推广”的统筹和类案监督的办案模式下,对监督线索“竭泽而渔”式的挖掘必然会导致模型的短缺。
针对监督项目的全面化加强问题,大数据驱动法律监督线索挖掘的核心是构建模型,目前“个案分析——提取特征——分析研判逻辑——确定建模逻辑——建模处理数据——发现线索”的大数据监督模式下,缺乏对监督模式的类型化梳理,缺少法律监督线索全面挖掘的目标下对重点领域的模拟建模,“数据赋能检察,数据驱动检察”的规模化效应尚未达成。
(二)监督项目化,非动态监督
法律监督作为程序性启动性监督,性质具有滞后性,但并非不要求法律监督的效率性。在社会的网络化进程中,法律对社会的调控应由“裁断行为后果”前移为“塑造行为逻辑”,法律的预防形塑作用逐渐超越惩处恢复作用,[16]社会的变化导致的法律调控功能的变化,以及检察机关发挥法律监督作用参与社会治理的功能发挥维度,都对法律监督效率提出更高要求。针对已经发生法律效力的监督事项,及时发现问题、纠正问题才能最小程度的伤害法律权威。大数据法律监督的特性决定需要一定时间区间内的大量数据为分析对象,这就监督线索挖掘的定期性导致监督业务办理项目化特征。
在省级院统筹的初期下,为了突显大数据法律监督的效果,采取集中专项行动的工作方式,对具有典型性和普遍意义的监督模式进行推广,达成“类案治理、融合监督”的目标,一定程度上可以提高工作质效。但长期来看,大数据驱动法律监督会成为检察数字化转型的基本要求,信息社会的预防形塑对法律监督滞后性的冲击下,项目式与动态监督的冲突会愈加突出。
(三)优势倾斜化,非均衡监督
大数据分析技术对于法律监督线索挖掘的增益作用明显,但技术的应用是否会导致掌握技术的部门、机关对未掌握此技术的部门、机关的影响值得警惕。为了扩大自己的监督优势,谋求“首创”地位,可能会盲目夸大自身大数据监督的实际效果,考评体系中应当注意甄别,省级层面的备案审查制度也应从符合规划框架、无重复建设的形式审查走向符合类案监督、系统治理的实质审查,浅层次的监督应该得到控制。大数据监督能力卓越的地区以其思维理念与话语体系影响着其他地区。长久以来,信息技术助力检察工作以创新成果的形式予以“肯定——推广”,但限于人才储备较少、线索发现能力不强、运维不足等问题,应用推广陷入“波纹效应”怪圈,其他地域的使用效果不佳,而掌握了大数据监督模式的个人、部门和机关会逐步拓展监督业务范围,容易导致“强者愈强、弱者愈弱”的局面。
数据分析技术对法律监督线索发现具有毋庸置疑的作用,但运用技术的司法化或司法的技术化都应当保持理性。应重点在以下三个方面加以完善:一是模型构建需要建立正反思维,注重社会治理贡献的同时不容忽视对侦查权、司法权的监督,将点状监督逐渐发展成面状的全生命周期系统监督。二是模型应用根据监督模型特性监督领域较明确,而监督模型选择应当注重限度及实用问题,模型的统筹推广增强。三是加强“深度学习”领域模型的探索,但“弱人工智能”时期,应以“普及基础上提高”为指导激发检察官建模的熟悉程度和运用热情,逐渐做到要素提取、模型构建成为办案的基本流程。
[1]因大数据法律监督发展时间尚短,呈现出大量数据基础分析与大数据技术的包容,实践中未严格区分类型,而将其统称为“大数据技术”,且要素或关联性分析由检察官完成、作用均为驱动法律监督线索挖掘,本文将大量数据的基础分析与大数据技术统称为“大数据技术”。
[2]公安机关的大数据侦查的原理是“侦查部门通过采集海量数据建立数据库,建立关联性分析、数据碰撞、数据可视化、数据画像等规则,对犯罪嫌疑人进行画像等,获取破案的线索和情报”。大数据与监察的结合是基于“知识图谱”或“元母计算机”算法模式对大数据挖掘技术获取的样本数据进行算法编制,获取其中的标识信息,进而设计系统模型,达到数据挖掘和系统构建的目的。处于探索阶段的元母计算模式拥有要素的自适应算法,更能完全适应大数据时代系统发展的新技术要求,但因为技术应用发展阶段的问题,基于知识图谱的大数据监察模型是目前的应用方式。
[3]合情推理:根据已有的事实和正确的结论(包括定义、公理、定理等)、实验和实践的结果,以及个人的经验和直觉等推测某些结果的推理过程,是一种依据已有的经验和知识作出符合一定的经验与事实的推测性的思维方法。
[4]参见印大双:《法律逻辑与侦查逻辑研究》,中国社会科学出版社2009年版,第193页-195页。
[5] 赵美娜:《大数据赋能刑事监督立案线索发现的实践路径》,《中国检察官》2022年第12期。
[6]相关关系是指两个数据值之间的数理关系相关,当一个数据值增加时,另一个数据值很有可能随之增加。不追求精确性,不必然确定两数值的因果关系,追求丰富性。
[7] 张军:《坚持以习近平发展思想为引领,加强新时代检察机关法律监督》,《求是》2022年第4期。
[8] 参见项金桥:《数字检察的实践背景与深化路径》,《中国检察官》2022年第9期。
[9] 参见黄宝跃等:《互联网中检察监督线索的监测和发现》,《人民检察——以人工智能深度学习算法为视角》2021年第18期。
[10] 翁跃强等:《大数据赋能法律监督的价值与应用》,《人民检察》2022年第11期。
[11] 数据来源于浙江省检察院《数字检察快报》,2022年5月24日。
[12]刘品新:《智慧司法的中国创新》,《国家检察官学院学报》2021年第3期。
[13]参见陈理平、诸文彪、陆海:《社区矫正智慧检察监督模式实证研究 ——以绍兴市检察机关创新实例为样本 》,载《新时代智慧检务建设论文集》,北京正义网络传媒有限公司编,第172-188页。
[14]姜昕、冯小光、王毓莹、王昱:《大数据赋能虚假诉讼检察监督的基础、应用与拓展》,《人民检察》2022年第19期。
[15] 参见黄宝跃等:《互联网中检察监督线索的监测和发现》,《人民检察——以人工智能深度学习算法为视角》2021年第18期。
[16]参见齐延平:《数智化社会的法律调控》,《中国法学》2022年第1期。
责任编辑:晓莉