许梓涛黄炳森潘微科明仲
深圳大学大数据系统计算技术国家工程实验室深圳大学人工智能与数字经济广东省实验室(深圳)深圳大学计算机与软件学院
根据现有的类案推荐方法得到的相似案件,其精确度通常很难满足法官的需求,辅助判案效果有限。为此,提出了一个基于上下文感知的类案匹配和推荐模型(CASCMR).模型为实现端到端高效率的文本匹配与推荐,使用多语义文档表达框架,并通过文本向量预先计算与存储,减少匹配时间,进而提高效率。具体而言,为了更好地对法律长文本进行建模,CASCMR使用BERT对数据进行编码,利用其注意力机制捕获文本长距离依赖信息。同时,考虑法律文本从局部到全局的信息,利用双向LSTM和CNN分别获取文本的上下文信息和局部语义特征,提高法律文本的表征能力,从而提升模型的预测性能。将所提出的模型应用到中国法研杯2019相似案件匹配任务,实验结果显示,与目前最好的方法相比,匹配和推荐精度的提升效果较为明显。
类案匹配类案推荐BERT注意力机制法律人工智能
1 相关工作
1.1 文本匹配
1.2 法律人工智能
2 上下文感知类案匹配和推荐模型
2.1 问题定义
2.1.1 类案匹配
2.1.2 类案推荐
2.2 上下文感知类案匹配和推荐框架
2.2.1 基于BERT的词嵌入
2.2.2 基于Bi-LSTM的上下文信息提取
2.2.3 基于CNN的局部语义特征提取
2.3 训练预测
2.3.1 Triplet损失函数
2.3.2 类案匹配
2.3.3 类案推荐
3 实验结果与分析
3.1 数据集
3.2 评价指标和模型参数
3.3 实验结果与分析
3.4 消融实验
3.5 类案推荐数据集
3.6 实验结果和分析
4 总结
主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会