当前位置:展会首页 /同期活动 / 有奖征文

也可直接联系我们

方式一 拨打报名热线或邮件咨询:

电话: 010-67046081

邮件: 195024562@qq.com

方式二 填写参会确认表

表单下载: 下载

发邮件至: 195024562@qq.com

或传真至: 010-67046081

2023·智慧检务篇 | 创新论文之“大数据赋能法律监督的逻辑起点、实践样态和未来图景”

  为深化政法智能化建设,加强“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”等信息平台建设,深入实施大数据战略,实现科技创新成果同政法工作深度融合。法制日报社已连续举办了六届“政法智能化建设技术装备及成果展”。

  作为装备展配套活动,法制日报社于去年3月继续举办了2023政法智能化建设创新案例及论文征集宣传活动,活动征集了“智慧治理”“智慧法院”“智慧检务”“智慧警务”“智慧司法”创新案例、方案、产品、论文,2023年6月25日结果揭晓发布。入选的各类创新案例、方案、产品、论文在2023年7月10日至11日举办的成果展上进行了集中展示,并已编辑整理成册——《2023政法智能化建设创新案例及论文汇编》。

  该汇编分为智慧治理篇、智慧法院篇、智慧检务篇、智慧警务篇、智慧司法篇五个篇章,为政法信息化、智能化建设提供及时、准确、 实用的资讯信息与经验观点。

  应广大读者要求,我们特开辟专栏,分别将部分创新案例、创新方案、创新产品、创新论文进行展示,敬请关注!

  以下推出的是《智慧检务篇 | 创新论文之“大数据赋能法律监督的逻辑起点、实践样态和未来图景”》

  

  大数据赋能法律监督的

  逻辑起点、实践样态和未来图景

  ——以检察大数据法律监督平台构建为切入点

  钟会兵 李婷 邓中孟 赵雨蝶

  四川天府新区人民检察院

  (四川自由贸易试验区人民检察院)

  【摘要】:构建检察大数据法律监督平台是深化司法体制改革、推动法律监督方式转型、实现数字法治建设目标的需要。大数据法律监督平台构建应当坚持需求主导、法域融合、绿色开放、安全可靠四大原则,通过数据采集、信息要素化、算法模型构建、智能分析处理、人工筛查处置等步骤,将外部分散数据转化为规范化法律监督要素。在平台设计上应采用分层设计思维,将平台分为基础设施、数据资源、数据分析、应用功能和用户五个层次,实现高内聚、低耦合,确保平台的高可靠性及易维护性。

  【关键词】:法律监督、大数据、算法模型、数字化平台

  一、基于大数据构建法律监督平台的逻辑起点

  (一)构建检察大数据法律监督平台必要性分析

  “科技兴,则法治强。现代数字科技已经成为法治现代化的重要引擎。”[[1]]推进法律监督工作的数字化智能化建设,是在大数据背景下创新法律监督的有效指引,是实现数字法治建设目标的客观需要。在国家深入推进大数据战略背景下,将大数据、区块链等技术运用于检察监督办案中,全面整合检察机关内外部的法律大数据资源,以检察大数据监督信息化发展新样态推动提升检察监督质效,俨然成为进一步深化检察改革的方向之一。大数据法律监督平台将法律监督司法逻辑与数字时代的算法、代码相融合,能够实现检察机关发展模式和办案思维模式的优化[[2]],提升办案业务水平和法律监督能力,有效完善检察机关依法能动履职体系,强化诉源治理体系,为解决当前法律监督工作面临的难点痛点问题提供了一种全新视角和方法路径。

  (二)构建检察大数据法律监督平台的可行性分析

  一是各地检察机关结合司法办案需要,积极探索大数据+检察工作新模式,先后研发了各类基于大数据支撑的法律科技创新产品,为大数据法律监督提供了模型基础。二是最高检在全国部署运用统一业务系统,主动推进跨部门数据共享工作,已达到大数据的级别,具备大数据的4V特征,[[3]]为建立大数据法律监督平台提供了数据基础。三是各地检察机关以数学算法为核心,积极研发智慧检务系统,现代前沿科技在检察事务中的应用为构建大数据法律监督平台积累了一定的技术研发基础。四是近年来四级检察机关通过公招、遴选等方式招录了一大批互联网信息通信技术专业人才,并通过举办信息化网上轻应用大赛、大数据法律监督模型竞赛等活动,积极培养具有大数据思维的检察技术人才。

  二、当前大数据法律监督平台构建存在的问题

  (一)数据来源问题仍未攻克

  大数据的前提是大体量的数据,而当前检察数据主要来源于检察机关内部自有数据以及裁判文书网等互联网开源数据,在整体上难以满足这一需求。[[4]]此外,数据权限多维、归口不一,“两法衔接”信息共享平台运行依然存在人工录入自主性强、行政执法案件量大与人工比对排查效率低的实际问题,对于信息的紧密衔接,行政执法机关往往存在一定程度的抵触和拖延,也往往导致数据共享推进缓慢而搁置或停止。

  (二)大数据深度运用不充分

  目前,传统简单累加、比对的数据分析工具和分析方法仍是数据处理的主要手段。[[5]]已有的大数据法律监督平台对数据挖掘与应用力度不足,主要为案件办理提供法律法规、裁判文书以及相关信息的查询,停留在浅表化的法律知识、案件信息及其他相关信息的获取层面,对于各类信息聚合后挖掘深层次成因的运用不够。

  (三)监督平台体系性不强

  大数据法律监督平台构建是系统工程,平台研发往往聚焦服务企业,或者解决刑事、民事等专门类型的问题,尚未实现“四大检察”的融合互通。此外,目前从法院、公安、行政执法等部门对接收集的数据无法直接导入检察机关内部办案系统,跨部门线上数据传输、线索推动等瓶颈尚未突破。

  (四)供需结合不够紧密

  大数据法律监督平台研发与司法实践需求脱节,存在“技术拖着业务应用走”现象和“两张皮”问题。一方面,以“实战化”为导向强化应用不够,在独立性智能应用等具体方面则更多依靠人工介入。另一方面,由于技术等多种原因的限制,智能辅助办案运用的范围较窄,办案人员使用积极性不高。

  三、基于大数据技术构建法律监督平台的优化路径

  (一)大数据法律监督平台构建原则

  一是需求主导,以司法办案和为民服务需求为主导,聚焦法律监督主责主业,把保障人民群众切身利益、破解人民群众急难愁盼难点痛点问题作为着力点,打造优质、实用、好用的法律监督平台。二是法域融合,平台监督重点要实现“四大检察”“十大业务”全覆盖,对司法案件开展“一案三查”,同步审查是否存在行政违法、刑事追诉、民事追责等情形,打破刑事、民事、行政壁垒。[[6]]三是绿色开放,要求检察机关大数据法律监督平台系统能够互相兼容、有机融合,并且在数据来源和用户上对外开放,既为司法机关、行政机关执法司法办案提供智能辅助,还为党委政府科学决策部署提供指引帮助。四是安全可靠,要稳步推进自主可控在大数据法律监督平台中的系统性应用,通过不断学习、更新迭代,实现平台监督点和监督面的扩展,保持系统的可持续发展。

  (二)大数据法律监督平台运行模式

  大数据法律监督平台遵循一般软件系统的运行模式,数据处理流程如下图所示。

  

  1.数据采集。数据采集是大数据平台建设的首要环节,是开展数据分析处理、挖掘数据价值的基础。数据采集主要分为确定数据采集范围和数据采集关键技术两个过程。数据采集范围可分为内部数据和外部数据,包括司法办案信息化平台中的法律监督的数据、与其他执法司法机关共享业务数据、互联网平台公开数据。针对不同来源、不同种类、不同格式的数据,可以采取直接同步、Hadooop分布式架构存储、HDFS文件系统同步、网络爬虫技术等方式进行全面收集。

  2.数据信息要素化。数据信息要素化是对相关法律术语和可能成案的口语化表述进行人工标注,从中提炼法律监督的【关键词】,构建法律监督要素数据集,作为模型构建和模型训练的初始条件,这一步需要检察业务人员充分运用专业知识和办案经验,不断扩充和完善数据集。

  3.构建算法模型。构建算法模型是指将数据要素作为原材料,运用自然语言处理技术(Natural Language Processing,简称NLP)理解数据文本内容并自动分类,有效提高信息检索效率并缓解信息过载的问题。基于深度学习的文本分类算法通过模拟人脑神经网络机制,为文本分类提供一种端到端的解决方案,能够有效提高文本分类的准确率。目前应用较为成熟的深度学习算法模型主要有基于前馈神经网络的模型、基于RNN(循环神经网络)的模型、基于CNN(卷积神经网络)的模型、混合模型。在实践中,应根据数据源特点选取适当模型,以获得最优性能。

  4.智能分析处理。智能分析处理就是聚焦法律监督工作重点,利用技术手段对发现的线索进行关联分析、数据碰撞,挖掘出更多有价值的信息,延伸法律监督触角,主要包括案件类案分析、量刑辅助、决策辅助三个方面。在类案分析方面,可以在使用基于统计和基于语义的文本相似度计算方法外,结合网络表示学习和文本卷积网络的算法,深入挖掘不同案件中的内在联系,有效提升类案发现准确率。在量刑辅助分析方面,可以利用深度学习技术自动提取常见罪名与定罪、量刑有关的事实、情节属性,从类案判决中建立要素与量刑指导意见和相关法律条文之间的逻辑关系,生成量刑计算模型,辅助检察官提出精准化的量刑建议。在辅助决策分析方面,以司法办案数据库为基础,构建法律监督核心业务指标,从多个维度提供可视化、实时化态势分析和展示,及时发现社会治理相关问题,提升管理者科学决策水平。

  5.人工筛查处置。目前,人工智能技术仍处在发展阶段,在处理不确定性上尚显不足,只能将其作为辅助手段,还需要结合人工筛查处置作出合理判断,主要分为对大数据平台筛选案件进行初步审查、启动深入调查、作出审查决定三个步骤。

  (三)检察大数据法律监督平台基本框架

  架构设计是支撑系统运行的顶层环节,如果缺乏有效的数据整体架构设计,会出现数据不可知、需求难实现、数据难共享等一系列问题。大数据法律监督平台采用分层设计思维,实现高内聚、低耦合,确保平台的高可靠性及易维护性。基本框架可由基础设施层、数据资源层、数据分析层、应用功能层、用户层五个层级构成。

  1.基础设施层。基础设施层也称支撑层,实现对整个平台部署运行的硬件承载,主要包括服务器、网络、存储设备、信息安全基础设施等物理资源。在建设过程中充分考虑各类资源整合,依托云计算使支撑平台虚拟化,确保资源调配、运行维护更加高效便捷。

  2.数据资源层。数据资源层以检察工作网、政务网、互联网平台各类数据为基础,使用Hadoop框架来实现集群存储、计算,使用MapReduce将计算任务发布到集群中的各个节点以实现并行计算,通过对信息进行汇集、加工、整合,形成标准的数据资源池,为应用功能层提供有效的数据资源。

  3.数据分析层。数据分析层也称中间层,即搭建数据与各功能模块之间的联系,为应用层提供对应的数据分析算法模块,实现各种分析算法的并行化处理,包括数据预处理、数据挖掘、结果展示等功能。这一层是大数据平台的核心,利用深度学习算法,基于分布式调度架构,提供实时的数据检索、计算分析,深入挖掘数据价值。

  4.应用功能层。应用功能层采用微服务架构、前后端分离设计模式,提供各种业务逻辑并对各业务流程进行控制和调度。根据功能不同可分为四大模块:辅助办案、辅助决策分析、案件移送,实现数据管理、数据分析、数据可视化展示等功能。辅助办案模块通过构建算法模型对刑事、民事、行政案件进行监督,为检察办案提供智能辅助;辅助决策分析系统,主要通过对系统中汇集的大量案件信息进行分析碰撞,以可视化的方式展现案件发展趋势,为检察机关、党委政府制定或者调整执法司法政策,开展专项治理等提供可靠的决策支撑;案件集中移送系统,主要为行政执法机关、公安机关、检察机关和人民法院之间跨系统移送相关案件线索提供通道。

  5.用户层。用户层提供平台和用户之间的接口,根据不同业务需求,综合考虑交互性、实用性,定制手机端、PC端、大屏展示端、Pad客户端,最大化满足用户体验效果。大数据法律监督平台的目标用户主要包括行政执法机关、公安机关、检察机关、人民法院、科研院所和社会公众。

  [[1]] 张文显:《论中国式法治现代化新道路》,载《中国法学》2022年第1期。

  [[2]]高景峰:《法律监督数字化智能化的改革图景》,载《中国刑事法杂志》2022年第5期。

  [[3]] 大数据的4V特征:体量巨大(volume)、类型繁多(variety)、时效性高(velocity)、价值高密度低(value)。

  [[4]] 参见张亚军,黄华.机遇与挑战:《我国智慧检务建设的发展隐忧与平衡路径》,载《河北法学》2021年第2期。

  [[5]] 参见林竹静:《“人工智能+大数据”驱动的智慧检察路径规划——兼论检察大数据(上海)实验室的发展》,载《上海法学研究》2019年第9卷。

  [[6]]徐日丹,常璐倩:《打好综合履职组合拳 知识产权检察跑出“加速度”》,载《检察日报》2022年4月26日,第3版.

责任编辑:晓莉