当前位置: 首页 > 学术研究 > 学术调研

信息化背景下司法大数据应用价值探索的实证分析

——以C市W区法院司法大数据应用为切入
作者:张静 罗燕飞 姜龙  发布时间:2024-03-01 12:13:02 打印 字号: | |

研究背景

党的二十大报告擘画了以中国式现代化全面推进中华民族伟大复兴的宏伟蓝图,强调“必须更好发挥法治固根本、稳预期、利长远的保障作用,在法治轨道上全面建设社会主义现代化国家”。《“十四五”国家信息化规划》明确提出,“要加快构建数字社会,极大提升基于数据的国家治理能力现代化水平”。司法大数据是由司法机关内外快速产生和流转的案件、数据、视频、音频等多样数据类型组成的,超越常规提取、储存和分析能力且能够分析和预测未来的海量数据。司法大数据的充分运用具有促进司法办案、提供党政决策参考、指引公众个体行为三重价值,是信息化背景下人民法院参与社会治理,实现审判能力现代化的必由之路。


内容提要

本文以司法大数据在CW区法院的应用为切入,梳理司法大数据在CW区法院内外的应用现状,准确把握司法大数据在实然应用中的供需偏差,深度分析在信息化背景下,司法大数据应用的理念局限、技术梗阻和机制缺位,提出以大数据思维与司法运行深度融入为前提,以建设司法大数据中台为核心升级司法大数据挖掘应用技术水平,完善司法大数据应用的配套机制,充分发挥司法大数据的应用价值。


主要观点

司法大数据本是法院信息化的产物,其价值的最终实现也必须依赖于信息化的手段。思想为魂,司法大数据价值实现路径的应然回归当以思维更新为先导,将大数据思维融入信息化司法运行全过程;技术为骨,司法大数据价值的实现关键在于以司法大数据中台建设为核心,实现司法大数据识别、归集、分析的技术突破;机制为躯,司法大数据应然价值最终落地需以制度机制为载体,在大数据思想引领驱动下长足运行。

(一)三重递进破除司法大数据应用中的理念局限

1.完成从被动审理到主动治理的思维转向打破司法大数据内部性僵局。在持续高强度的办案压力下,人民法院诉讼解纷容量接近极限,纠纷解决的质效受到极大影响。从而使以主动形式参与社会治理成为必然之选,人民法院参与社会治理从被动为主转向主被动并重成为必然之举。当这一转向完成,“被动参与→内部需求→内部数据→外部数据渠道萎缩→因无数据支持而无法主动参与”的恶性循环即被打破并转变为“主被动同步→内外部需求同步→内部数据同步→内外部数据渠道拓展→通过司法大数据开辟新的治理路径,进一步深化主被动同步的参与社会治理的新样态”这一良性循环。司法大数据内部性僵局将从根源上打破,让司法大数据全向服务党政决策、服务社会公众具有内生动力。

2.本着以人民为中心理念实现管理者角色与服务者角色的调和。作为司法大数据的管理者和服务提供者,面临信息安全与资源共享矛盾困局,破局的关键是明确以人民群众为中心的司法大数据应用目的。要实现这一目的,需要将司法大数据的应用场景向两方面延伸。一是向立法、行政领域延伸;二是将应用场域直接向人民群众延伸。

3.秉承大数据思维完成从小数据利用到大数据利用的思维革新。思维变革的核心在于司法大数据成果撰写者对司法大数据预测功能的自信和应用主体对司法大数据预测功能的信任。这一思维变革的核心又以树立全量数据意识,接受相关关系的非精确性为前提。追本溯源,在大数据应用之初,预测与验证两大功能是以预测为主验证为辅,大数据的初始应用场景就在于可以较之于传统的统计方法,其对未知因素和事物未来发展趋势的预测更为准确、更为科学。

(二)建立以司法大数据中台为核心的技术保障体系

1. 构建司法大数据中台建立区域司法大数据生成应用体系。由上级法院构建统一的司法大数据中台,汇聚区域内的数字资源,实行数字资源统进,数据资料统出。具备数据接入、数据标准化、数据融合、数据质量管理、数据模型设计、数据标签设计、画像分析以及数据资产管理和全程监控等功能。通过对各类源数据的全量数据统一汇聚、治理、融合,实现一定区域内法院司法全量数据的统一汇聚与集中管理,突破应用系统管控,解决数据孤岛问题,为上层应用提供标准、干净的、智能的数据。建设内容具体包括数据管理标准规范、平台支撑中心、数据处理中心、数据融合中心、数据服务中心、数据资源运营管理中心、资源共享交换平台、平台安全运维体系。

2.应用司法大数据中台解决数据采集、传递、储存难题。由司法大数据中台统一负责数据采集、储存。针对法院内部及外部单位各相关的业务系统等不同数据来源,司法大数据中台依据各方数据资源情况,分别采用不同的采集方式,其中,对于法院内部业务系统数据,采用ETL 数据采集方式,直接从区域内法院办公办案系统采集数据。发挥技术优势对扫描文件、庭审视频等非结构化数据或半结构化数据进行统一规范化提取。打造司法数字资源库和数据资源库,使用共享交换技术,将不同层级法院各系统及法院外部各单位的数据汇集到原始库中;对于不同的数据类型,采用不同的存储方式,支持结构化数据存储,文书等半结构化数据存储,及PDF、图片、音视频等非结构化数据存储。

3.运用司法大数据中台实现数据标准化。由司法大数据中台集合优质力量,依托算力优势对采集到的数据进行标准化处理和标准化管理。具体而言由数据中台对采集到的数据进行抽取、清洗、转换等处理,保证数据质量和数据规范。对数据输入、利用、输出全过程建立标准化体系,保障数据的规范性和一致性;对数据的准确性、完整性、规范性、一致性、唯一性、关联性等进行全方位数据质量检测并分类存储至各类标准库中。建立基于数据分析需求的数据主题集市,依据不同的需求对数据进行抽取加工,形成主题集市库。对数据进行法律要素、案件要素及关系抽取,为后续数据分析和应用服务提供高性能的关联分析及检索支撑能力。

4.发挥司法大数据中台技术整合优势确保大数据成果质量。通过司法大数据中台技术优势和联动效能,在司法大数据中台的统筹下,将司法大数据库与云数据中心建设同步进行,推进云网一体化建设发展,促进计算资源、网络设施、数据资源有机融合,强化与算力和算法中心合作,基于自然语言处理、大数据挖掘等技术结合数据资源进行高性能计算,实现大数据分析、获取的低延时、高可靠、强安全,为司法大数据应用提供算法和计算支撑。开设案件专题分析、态势分析、宏观预测分析等大数据分析功能,支持立体化、可视化结果展示,提供智能搜索等大数据应用功能,并提供集成数据分析功能和数据应用功能的数据服务门户。

5.依托司法大数据中台让司法大数据成果流转有序。由司法大数据中台提供统一数据接口总线服务。依托数据共享交换系统,开发网页查询服务、接口访问服务、点对点传输服务、消息的发布与订阅等服务形式。基层法院以在线链接方式对数字化资料进行查看,对数据资料进行查询,在线提交司法大数据分析需求,由数据中台专业人员以专业分析方法通过大算力设备展开大数据分析。以司法大数据中台的服务为基础,在基层法院门户网站或新媒体平台开设司法大数据公众查询客户端,在进行身份验证后提供符合数据安全的专项或普适性司法大数据分析服务。通过区域司法大数据中台的构建,既解决了基层单独建设司法大数据库效益较低的问题,也解决了大量数字资料难以传递的问题,更解决了司法大数据分析专业性、准确性的问题。

(三)建成司法大数据生成应用闭环运行机制

1. 强化专业人才供给。现阶段的专业化人才供给主要分为两部分,一是打造司法大数据专业人才团队。即根据基层法院案多人少、复合型人才供给不足的客观现实,以服务对象为区隔,以“技术+统计+法学”为配置模型,分别组建服务审执、服务党政决策、服务社会公众三大司法大数据分析专业团队。分别负责法院内部司法大数据成果、党政决策所需司法大数据成果、社会公众所需司法大数据成果的数据收集和文稿撰写工作,遵循依次排班、兼顾办案等原则,同步做好工作量精准认定及评价,统筹团队异质性、角色合理性、目标明确性、领导有效性、任务依赖性、团队沟通等因素,以团队作业模式高质量完成司法大数据成果拟写任务。二是开展跨专业培训,优化技能提升。对于专业技术人员,对其进行基本法学知识的培训,提升其发现问题的敏感性,同时也降低沟通成本;对于法学专业人员,应进一步强调其在司法大数据成果制作过程中的框架搭建、矛盾问题总结、结论可行性论证等环节的指导作用,培训其掌握大数据分析所需的数据采集、分析的基本方法路径和系统操作规则,促进其丰富审判经验转化为司法大数据成果。

2.补齐平台功能。一是优化平台数据提取功能。在本地办公办案系统前台开设司法大数据提取功能,增设检索条件提高自由组合灵活度实现现有结构化数据的全量检索、全量提取。尝试拓展数字化材料数据化,以法院制作文书为试点,探索本院文书的全文检索功能,参照其他外部司法大数据平台功能设置,逐步增加法条索引、案例索引、学术观点索引等功能。将人民法院大数据管理和服务平台的数据层级下调到基层法院一级,向基层法院开放更多功能权限,为基层法院提供更多司法大数据分析技术和底层数据支持。二是整合各级各类数据平台。联通常用内网数据平台,统一各数据平台数据统计口径,消除平台间的数据壁垒设置贯穿各个平台的数据检索和比对功能。强化与本地区其他数据库的数据关联,与检察、公安、税务、金融等数据库进行对接,争取更多数据资源。三是开发社会公众应用端口。针对社会公众实施行为前的司法大数据需求,先针对较为普遍的民事行为开发行为风险司法大数据评估端口,为社会公众提供可靠的行为路径指引和风险提示,将法律的行为指引作用具象化。

 

责任编辑:温宛莹