根据现有的类案推荐方法得到的相似案件,其精确度通常很难满足法官的需求,辅助判案效果有限。为此,提出了一个基于上下文感知的类案匹配和推荐模型(CASCMR).模型为实现端到端高效率的文本匹配与推荐,使用多语义文档表达框架,并通过文本向量预先计算与存储,减少匹配时间,进而提高效率。具体而言,为了更好地对法律长文本进行建模,CASCMR使用BERT对数据进行编码,利用其注意力机制捕获文本长距离依赖信息。同时,考虑法律文本从局部到全局的信息,利用双向LSTM和CNN分别获取文本的上下文信息和局部语义特征,提高法律文本的表征能力,从而提升模型的预测性能。将所提出的模型应用到中国法研杯2019相似案件匹配任务,实验结果显示,与目前最好的方法相比,匹配和推荐精度的提升效果较为明显。
1 相关工作
1.1 文本匹配
1.2 法律人工智能
2 上下文感知类案匹配和推荐模型
2.1 问题定义
2.1.1 类案匹配
2.1.2 类案推荐
2.2 上下文感知类案匹配和推荐框架
2.2.1 基于BERT的词嵌入
2.2.2 基于Bi-LSTM的上下文信息提取
2.2.3 基于CNN的局部语义特征提取
2.3 训练预测
2.3.1 Triplet损失函数
2.3.2 类案匹配
2.3.3 类案推荐
3 实验结果与分析
3.1 数据集
3.2 评价指标和模型参数
3.3 实验结果与分析
3.4 消融实验
3.5 类案推荐数据集
3.6 实验结果和分析
4 总结
主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会