时间:2019-04-16 13:45:46 来源:江苏省高级人民法院、人民法院司法大数据研究基地
[法安导读] 摘要:依托全国法院裁判文书大数据,按照图谱构建→情节解析→权重排序→类案识别→模型训练→量刑预测→偏离
摘要:依托全国法院裁判文书大数据,按照“图谱构建→情节解析→权重排序→类案识别→模型训练→量刑预测→偏离预警”的基本步骤,构建了服务裁判尺度统一的“同案不同判预警平台”。平台整合了相似案例推荐、法律知识推送、量刑智能辅助、文书智能纠错、量刑偏离预警五大功能模块,不仅为员额法官办案提供智能化辅助,同时也给案件质量管理提供了精准化的参考。可以说,预警平台的开发与应用在充分保障法官依法独立办案的前提之下通过静默化的案件质量管理促进裁判尺度的统一,从而为审判体系和审判能力现代化建设提供了坚实的保障。
一、预警平台的开发背景与时代价值
(一)预警平台的开发背景
1. 实现同案同判是司法改革的核心目标
习近平总书记明确指出,“要努力让人民群众在每一个司法案件中都感受到公平正义”。司法实践反复证明,司法裁判的公正性往往来自于裁判的一致性。可见,司法公正是司法改革最为核心的目标,而同案同判则是司法公正最为底限的要求。传统上,法院内部主要通过两种途径来保障同案同判:第一,提高法官的正确认定事实和适用法律的能力;第二,围绕案件审批所构建起来的案件质量管理体制。当前,员额制和司法责任制改革已经在全国范围内展开。本轮改革的核心就在于还权于一线法官,真正实现“让审理者裁判,让裁判者负责”。然而,对入额法官,在放权的同时如何在提升案件办理能力、合理规范自由裁量权,从而切实提升审判质量、充分落实司法责任制,最终实现同案同判与司法公正就成为摆在全国法院面前的迫切课题。
2. 大数据驱动的审判体系为实现同案同判提供的全新可能
党的十八届三中全会明确提出“推进国家治理体系和治理能力现代化”的战略要求。法院是国家治理重要参与者,法院审判体系和审判能力的现代化被视作国家治理现代化在新时期的重要需求和根本体现。可以说,推进审判体系和审判能力现代化是中国当前全面深化司法改革的总目标。在传统的视角中,司法信息化是司法现代化的重要手段,信息化技术的运用确实大幅度提升了司法的数字化与网络化水平。然而,在小数据时代,受到理念与技术的限制,司法信息化驱动的司法现代化呈现出鲜明的法院本位与管理本位,不能有力回应法院工作人员对自动化、精准化与智能化司法辅助的期待。当今社会正在由DT(大数据)时代向AI(人工智能)时代过渡。技术日益成为重塑社会生活的重要力量。大数据与人工智能技术正逐步被应用到教育、医疗、司法等细分领域。前沿科学技术给司法现代化,尤其是通过技术来辅助实现同案同判带来全新可能。
(二)预警平台的时代价值
针对员额制与司法责任制改革放权之后如何加强科学、有效的监督管理问题,江苏高院和东南大学联合成立的最高人民法院司法大数据研究基地研发出“同案不同判预警平台”,利用法律人工智能和司法大数据技术,从百万量级的海量判决文书中汇聚法官集体智慧,为法官提供智能辅助量刑、偏离度自动监测和类案及法律知识推送等智能审判辅助。智能辅助量刑通过自动分析公诉书和庭审记录,提取案件情节信息,智能预判量刑结果,并对高偏离度的案件实时进行预警。
预警平台的价值主要体现在以下三个方面:第一,大幅度提高法官办案的辅助化与智能化水平:通过类案智推、量刑推荐、文书质量纠错、偏离预警等功能模块,为法官办理案件提供智能化的决策辅助;第二,大幅度提高司法管理的精准化与静默化水平:一方面,法院庭长不用再对每个案件进行审批,而只需要对偏离度较高的案件进行有针对性的干预,司法管理实现了有的放矢;另一方面,静默化表现在只在违规的时候法院工作人员才感受到管理的存在,当合规时感受不到管理的存在。第三,大幅度提高司法公正水平:预警平台有效衔接“还权”与“管理”,既保证员额法官依法行使审判权,又满足法院对案件质量管理的需求,从而提升案件质量、落实“同案同判”、推动司法公正,让人民群众在每个案件中感受到公平正义。第四,有力推动审判体系和审判能力现代建设。法官办案能力与司法管理能力是审判能力现代化的有机组成部分。“同案不同判预警平台”提供的类案推荐、量刑辅助、智能纠错与偏离预警等功能将为大幅度提升法官的办案能力与司法的管理能力,从而促进审判体系和审判能力现代化。第五,有助于探索中国特色的法院现代化之路。从世界范围来看,西方国家司法系统对信息化技术持谨慎甚至是保守的态度,而中国审判体系和审判能力现代化则包含显著的技术驱动含义。“同案不同判预警平台”本质上是借助前沿科学技术来实现司法公正,是“技术驱动的”,因此也是极具中国特色的法院现代化之路。
二、预警平台开发的技术机理
(一)“智慧法院”建设的三大技术路线
“同案不同判预警平台”是“智慧法院”建设的重要构成部分,因此要明晰该平台的技术机理就必须首先对“智慧法院”中对大数据与人工智能路线的基本思路。按照技术细节与技术目标的差异,可以将“智慧法院”建设的技术路线划分为初级、中级与高级三种。
1. “智慧法院建设”的初级技术路线
初级技术路线正是按照大数据技术的底层逻辑展开的,具体可以分为4个步骤。a. 内外司法数据的汇聚:在审判体系和审判能力现代化建设过程中将法院内部的案件、人事、政务、研究等数据以及与法院相关的银行、交通、政府、工业、商业、医疗、教育、舆情等外部数据进行汇聚。b.内外司法数据的联通:数据汇聚只是大数据最基本的步骤,汇聚之后要让数据能够达到应用水平,还需要按照统一的标准对数据进行抽取与转换。此时,通过文本处理、视频处理、语音处理、图片处理等技术对数据进行标准化就成为关键步骤。c. 内外司法数据的融合:在数据进行一定抽取与处理之后,通过数据融合的步骤整合成国家司法审判信息资源库。资源库由六大子库构成,分别是审判执行库、司法人事库、司法政务库、司法研究库、信息化管理库和外部数据库。上述六大子库并非彼此隔离,而是由统一的标准与规范形成数据之间的联通。d. 基于国家司法审判信息资源库的应用:通过提取、挖掘、加工审判资源库中标准化的数据即可以开发审判体系和审判能力现代化建设的具体应用,服务于司法公开、诉讼服务、案件审判、判决执行与司法管理。举例而言,经过高质量压缩的视频数据可以借助已有的网络平台进行庭审直播;证据经过图片识别技术(OCR)之后可以直接应用于庭审,并为判决书自动生成提供素材;经过虚拟现实技术(VR)转换的场景可以直接应用于虚拟现实展现犯罪现场和诉讼场景;经过三维成像处理之后的物证则可以应用于虚实一体化的示证平台。可以说,初级技术路线通过对内外司法数据的汇集、处理、融合实现了审判体系和审判能力现代化建设的应用。该路线是一种由数据层到应用层的双层结构。
2. “智慧法院建设”的中级技术路线
与初级路线形成明显对比的是,中级技术示意增加了“知识层”,从而由两层结构进阶为三层结构。故而,中级技术方案是通过知识图谱的技术围绕“知识层”展开。也就是说,初级路线是在汇集资源基础上的应用,而中级路线则是在挖掘资源基础上形成知识,并在知识上的展开应用。具体而言,中级路线分为四个步骤:a. 法律知识图谱的建构:围绕进入司法场域中的案件、人物(当事人、法官、检察官、证人、公众等)、事件三大对象,采用知识图谱的关键技术,对上述对象进行本体构建、本体管理、数据映射、实体匹配、本体融合,深度挖掘国家司法审判信息资源库中的案、人、事的本体特征及彼此关联,从而构建出案件知识图谱(如案件关键情节图谱)、人物知识图谱(如公众司法兴趣图谱、公众社交关系图谱)和事件知识图谱(如法律舆情图谱)。b. 知识融合:在分主题构建知识图谱的基础之上通过深度知识融合,形成国家司法审判信息知识库。相对于资源库而言,知识库是深层次的数据挖掘,而非浅层次的数据整合。知识库中包含案件知识库、人物知识库、事件知识库、法言法语知识库。申言之,知识库中包含所有类型案件的基本特征、关键情节;所有当事人的诉讼行为、社交关系、财产情况、前科情况等等;社会公众的兴趣爱好、社交网络;所有法官的案件专长、职业信息;司法舆情的形成机理;涉诉信访的形成机理等等。c. 基于国家司法审判信息知识库的应用:在知识库之上,通过向量计算、聚类、分类、协同过滤等基本应用技术便可以开发服务人民群众、服务审判执行、服务司法管理的智慧法院应用。d. 知识库反向支持资源库建设:需要特别强调的是,初级方案与中级方案并非单向度的,而是一种循环的闭合路径。国家司法审判信息知识库中的诸多知识将会反向服务于初级路线中的技术处理过程,实质提升国家司法审判信息资源库的建设质量。举例而言,法言法语知识库中的相关知识的嵌入将大幅度提升文本处理与处理过程中自然语义识别、语音转换与语音互译的精确程度。
3. “智慧法院建设”的高级技术路线
中级层面的应用只是知识库的单纯开发,尚未应用到预测、预警等人工智能的技术与算法。众所周知,知识图谱是人工智能技术的底层技术。相较于中级层面的技术路线而言,高级技术路线的显著特征是基于算法,采用本体推理、规则推理、路径计算、社区计算、相似子图计算、链接预测、不一致检测等核心技术,使得应用具备基于知识库的知识进行计算、推理、预测、预警的能力。以类案推荐应用和量刑建议推荐为例即可说明两者的区别。类案推荐的基本思路是通过情节、证据、争议焦点、适用法律等关键要素的自然语义识别形成特定的案件知识库,当出现新的案件时计算机通过提取新案件的关键要素,与原有知识库中的案件进行匹配,并推荐最为相似的案件。这种应用可以说是在知识库之上的直接应用。而量刑建议的应用则是在大范围学习特定类案量刑的基础之上,人工智能基于随机森林和决策树模拟案件判决结果(非简单基于量刑平均值)。这个过程还需要运用到人工智能中的认知智能。两者虽然只有一步之差,但却决定了技术路线的中级与高级的差异。当然,中级技术路线与高级技术路线并非完全隔绝的,中级技术路线的智慧法院应用可以在条件允许时采用高级技术路线的人工智能技术,从而提升相关应用的智能化水平。
(二)“同案不同判预警平台”的开发思路
通过前文的分析可以得知,“同案不同判预警平台”是典型的高级技术路线的应用,需要使用到大数据与人工智能的多项技术(机器学习、知识图谱和自然语言处理技术等),依托全国法院裁判文书大数据,按照“图谱构建→情节解析→权重排序→类案识别→模型训练→量刑预测→偏离预警”的基本步骤进行系统开发。
1. 图谱构建
“同案不同判预警平台”的第一步是让计算机能够读懂法律文书,此时就需要给人工智能理解法律问题的框架,这个框架就是法律知识图谱。具体而言,由法律专家对法律法规,司法观点,指导案例等法律知识进行碎片化处理,建立法律知识图谱。法律知识图谱定义了法律主体、客体、法律关系以及各种主观要件、客观要件、裁判规则的概念层次关系以及逻辑推理关系。根据不同案由的相关法律知识进行知识图谱的构建,是法律建模特征工程第一步,为接来下案例数据法律特征表示提供基础特征的定义。利用知识图谱技术对法律知识原始数据进行半自动的实体识别和知识链构建,大大提高法律知识图谱的构建效率。
图1:盗窃罪知识结构示意图(简化版)
2. 情节解析
利用第一步构建好的法律知识图谱,运用自然语义分析技术,通过对各类文书,包括起诉建议书、起诉书、判决书等案例数据,进行智能法律特征的自动标注和识别。提取其中的法律要素,对影响案件判决结果的因素进行提取,为后续的文书案例判决模型学习提供结构化训练样本,也便于方便法官对文书的情节案件法律要点进行快速了解。
3. 权重排序
在从海量文书提取足够情节之后,借助相关性分析,测算各情节与裁判结果之间的关联程度。有些图谱构建时认为是重要的情节,但实际上与裁判结果关联不大。由此,可以把案件事实情节的重要性进行权重的排序,比如刑事案件中,盗窃金额就是高权重情节,而被告人性别就是低权重情节。
4. 类案识别
在完成上述三项工作之后,再进行类案识别:同一案由之下的高权情节匹配。这里关键在于,系统优先匹配高权情节,而不是不分主次地关联所有情节。
5. 模型训练
在准确区分类案的基础之上,通过决策树的模型对系统进行良性模型训练。之所以选择决策树而非神经网络的模型是因为各个法官在判案的过程中,除了严格遵守法律法规的相关规定外,还可以合理实施自己的自由裁量权,因此案件的判决结果不是简单的单元累加模型,而是复杂的多元非线性组合模型。深度神经网络学习模型适合将原始数据整体输入,尽量保证数据的完整性,但是模型的决策的过程是个黑盒子,可解释性差。随机森林模型适合利用法律专家定的标签体系作为输入,在保证输入特征准确可靠的同时,也能够将模型的决策过程可视化,使结果更具说服力。随机森林模型的每个子模型是不同的决策树,每棵决策树相当于不同的法官,这模拟了法官的自由裁量权的实施过程,同时利用集体决策的方式保证结果的可靠性,避免了单一决策的随机性误差。
为了进一步考虑到地区的差异,并促进系统向优秀法官学习,系统在本地化部署的过程中,将根据本地区案例特征和法官档案数据作为模型权重参数加入到基础量刑模型中,对基础量刑模型结果进行优化,使得模型结果更符合当地法官的整体判决风格,确保一个地区的裁判规则统一。
6. 量刑预测
在充分训练之后,“同案不同判预警平台”就具备了量刑预测的功能,也就是在导入相应文书,系统自动识别关键情节,并根据已有的智能算法,按照最优决策树得出推荐的量刑结果。
7. 偏离预警
系统通过自动抓取案件卷宗材料,利用非结构化数据分析模块和自然语义分析技术,进行法律情节特征信息的自动提取,构造预测模型的输入数据格式,调用模型进行准确判罚结果的预测,并将实际判罚结果和预测判罚结果进行对比,计算偏离度。
三、预警平台的核心功能模块
由于“同案不同判预警平台”在开发过程中遵循了司法大数据高级技术路线所匹配的七大步骤:“图谱构建→情节解析→权重排序→类案识别→模型训练→量刑预测→偏离预警”,在整个开发链条中的每个环节都可以结合“智慧法院”建设不同的应用场景形成相应功能模块。
(一)相似案件推荐功能
在“同案不同判预警平台”的开发过程中,对类案的识别是必经的程序,只有精准识别类案才能进行科学的量刑模型训练,进而进行刑期的预测和偏离度的考察。正因如此,类案推荐也就在成“同案不同判预警平台”的当然功能模块。
法官在遇到疑难案件的时候,需要参考本地区及本省的参考案例,以往需要法官自己根据案件特征组织关键词利用文书检索工具自行检索,从大量检索结果中筛选与自己案件相似的类案,不仅效率低下,而且精准性不足。“同案不同判预警平台”与审判业务系统实现数据对接,可以实时获取案件卷宗、庭审笔录、裁判文书文本数据,利用非结构化分析引擎进行情节特征自动提取,利用后台智能类案模型进根据解析出来的情节特征自动推荐高度相似的案例,供法官办案参考,使法官能够更方便地汲取集体经验和前人智慧。
图2:相似案例推荐功能模块示意图
(二)法律知识推送功能
由于在“同案不同判预警平台”的建构过程中需要进行知识图谱的构建,因此会沉淀相应的法律知识、理论知识,这也就为法律知识推送模块提供了条件。一方面,系统可以根据法官当前办理案件的关键情节,平台会智能根据当前案件情节特征,后台智能匹配相应的专业知识库,推送给办案法官参考。另一方面,系统还构建了包含全国各地、各层级法律、法规、规章和其他规范性文件的数据库,可以通过自动识别和提取裁判文书中的法定情节,推送相关条文,大幅度减少法官的资料检索和工作量,提高法律适用的精确度。
图3:法律知识推送功能模块示意图
(三)量刑辅助功能
“同案同判预警平台”通过自动识别和提取当前案件庭审笔录或法官已撰写的裁判文书中的量刑相关情节,并综合分析法律法规、相关政策性规定、内部指导意见以及类似案件的平均量刑幅度,推送建议的量刑结果,使法官能够更为科学地把握量刑幅度,规范统一裁量尺度,促进实现同案同判,进一步提升法律适用水平。
同时,针对环境保护公益类、药监食品安全类等新型案件,由于缺乏历史裁判案例数据积累,系统将依靠后台特定领域的法律知识图谱构建专家决策系统,通过智能文书分析抓取核心关键情节,适配知识图谱中的相关决策路径,智能推荐该裁判路径下的法律依据和指导案例数据,结合类似案例的判决结果给出初步的量刑预测范围。
图4:量刑辅助功能模块示意图(案件列表界面)
图5:量刑辅助功能模块示意图(个案画像界面)
(四)文书纠错功能
在案多人少的情况下,法官面临着巨大的工作压力,难免百密一疏,法言法语使用不规范、相关数据错漏、文书说理不足等错误在裁判文书中并不罕见。知识图谱的构建还为文书纠错提供了可能,预警平台可以自动发现裁判文书中的书写错误,如法言法语不规范、判决结果笔误、金额和数量单位写错等情况,向法官高亮提醒。同时还可以参照裁判文书模板规范,根据法律实体构成要件和判定规则,自动检查法律实体关系,对说理不充分或者缺少关键情节说理的文书进行预警。
图6:文书纠错功能模块示意图(文书内容界面)
图7:文书纠错功能模块示意图(案件列表界面)
(五)刑附民调解辅助决策功能
做好刑附民诉讼事调解工作是人民法院在刑事司法领域构建和谐社会的重要司法措施,在新形势下具有重要的现实意义。刑附民诉讼案件主要案件集中在故意伤害、交通肇事、非法拘禁、寻衅滋事、抢劫、强奸等案件里。在此类案件审理过程中,通过邢民调解辅助决策模块,一方面法官可以进行减轻情节、加罪情节、赔偿金额的组合筛选和调整,利用系统智能计算出不同的判决思路下的量刑预测结果和判决偏离度;另一方面,法官也可以直接输入理想的量刑结果,系统将智能推荐出不同的减轻情节、加罪情节和赔偿金额的组合策略。在这样的辅助决策功能的帮助下,法官就可以在合理裁判尺度范围下,尽可能选取一个能够平衡双方当事人家属在赔偿和量刑的利益诉求的判决思路,从而更好的开展邢民调解工作。
图8:刑附民调解辅助决策模块示意图(量刑情节自由调整)
(六)量刑偏离预警功能
由于对法律的理解和适用存在差异,不同法官的裁判标准难以统一,同案不同判现象时有发生,严重影响了司法公信力。当法官确定判决结果,完成裁判文书编写后,系统将自动抓取法官编写的裁判文书进行智能分析,自动预警高偏离度的案件,并利用司法大数据可视化技术,通过类案判决分布和判决结果偏离状况分析,向法官解释产生高偏离度的原因。
图9:量刑偏离预警功能模块示意图(办案法官界面)
图10:量刑偏离预警功能模块示意图(办案法官界面)
在保证法官依法办案不受外部干预的前提下,作为审判管理者,如何对海量案件判决进行有效监督,一直是审管办推行审判监督工作的难题。传统的随机人工抽查方法虽然也起到了一定的作用,但尚无法实现案件质量管理的全覆盖。同案不同判预警系统可以实现实时案件偏离度检查和质量分析,为审判管理者提供本地区案件偏离度综合分析汇总。庭长和审管办领导只需要通过本地区总体偏离度大数据分析界面,即可快速掌握本地区案件质量总体概况和发展趋势,快速定位高偏离度的案件和案件类型,有针对性的执行监督工作,大大提高了审判管理工作的精准化水平。此外,对于高偏离度的案件,通过全流程可视化的管理界面进行实时、动态与定向化的管理。
此外,“同案不同判预警平台”还为院领导的管理提供了充分的便利。以前法院院庭长要通过对所有案件审批来实现对案件质量的把控,这种做法不仅费时费力,也不利于法官依法独立行使职权。有了这套系统,院庭长不再需要对所有案件进行干预,而只需要对系统预警超过一定范围的案件进行有针对性的管理。系统未预警的案件,法官有充分的自由裁量权。司法管理的效率与精准化程度都有了明显的提升。通过这套系统,既保障了还权一线法官,又实现了案件质量管理,这就是“放权而不放纵”。我相信随着系统的大范围推广,同案不同判的现象将得到有效缓解,司法公正与司法公信将会实质提升。
图11:量刑偏离预警功能模块示意图(案管人员界面)
结语
案件审理能力是法官在案件审理过程中适用法律、定纷止争的能力,是审判能力的核心要素。当前,案件审理能力提升瓶颈有两方面:一是法官人才储备仍然不够充分,职业素质层次不齐,案件审理水平的地区差异较大;二是由于当前处于诉讼爆炸时代,法官审判工作量日益攀升,疲于应付大量的简单重复劳动,员额制改革削减法官数量后更是雪上加霜。针对上述瓶颈,“同案不同判预警系统”以自动化与辅助化为导向,表现为:一方面,运用大数据技术对案件审理过程中的简单机械工作进行自动处理,减轻法官重复劳动的压力,提升办案效率;另一方面,运用大数据技术对复杂工作进行全面辅助,实现法律适用过程由个人经验向集体经验转变,从而提升审判质量。无论是简单工作自动处理还是复杂工作全面辅助,大数据技术的运用均不能取代法官在司法决策中的核心地位,但能够优化和升级法官个体能力和经验为主导的传统决策模式,强化司法决策过程的科学性。目前“同案不同判系统预警平台”在江苏已经部署了盐城、南京、苏州等中院、40多个区法院、200名法官在使用,成功预警高偏离度(三级预警)案件130多起,总预警案件占比总案件数量3.9%,准确率达到90% 。在使用过程中,各地法官也反馈了一些结合审判实务经验的宝贵建议及实际工作中的痛点需求,如增加实务中考虑到的非法定情节、罚金与缓刑的偏离度计算权重调整和取保候审刑期自动计算等等,对平台的改进和优化提供很多帮助。
当然,“同案不同判预警平台”仍然存在有待进一步完善的空间。首先,目前预警平台虽然已覆盖了刑事案由的80%,但下一步会仍需继续增加没有涉及到的案由以及支持用户定制专属案由。比如铁路法院审理涉及到环境资源类的案由,首先要查看关于环境资源类会涉及到哪些案由,对这些案由的文书数量进行统计,从中选择文书数量较多的案由,进行知识图谱的构建,利用构建好的知识图谱进行模型的训练。对涉及到知识产权类的案由也在逐步纳入到系统当中。对于已经训练好的案由,需要采集更多优秀案例进行训练模型,提高预测判罚的准确性。关于类案,后期会逐步采集更多的数据集,进行实时更新,优化类案推荐的准确性。将法官的决策路径用知识图谱的形式展示,对文书进行解析,为法官梳理出案件脉络,直观展示案件涉及的法律关系,节省办案时间。其次,“同案不同判预警平台”目前只涉及到刑事的量刑,但是法官办案是涉及到刑事、民事与行政三类案件。因此,下一步会开发民事版本和行政版本的同案不同判辅助办案系统,提高法官办案效率,杜绝冤假错案的发生,让人民群众在每一个案件中感受到公平正义。
编辑:广翰楼
声明:
本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。
征稿启事
品牌推荐更多>>