阿里达摩院获中国法律智能技术评测两项冠军,参赛模型底座已在魔搭社区开放

2月3日消息,由最高人民法院司改办和中国中文信息学会指导的中国法律智能技术评测(CAIL 2022)于日前公布比赛结果,阿里巴巴达摩院在八项任务中获得两个冠军,是唯一获得多项第一的参赛团队。据介绍,此次参赛使用的预训练大模型底座通义AliceMind-structBERT已在魔搭社区开放(https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_law/summary),该模型是法律AI领域首个亿级数据规模的大模型。

近年来,用AI辅助司法工作者提升案件处理的效率和公正性,逐渐成为法律领域的趋势。作为国内最权威的法律AI竞赛,CAIL已连续举办5届比赛。 据介绍,CAIL 2022设置了司法考试、事件检测、文书校对、类案检索、涉法舆情摘要、论辩理解、信息抽取、可解释类案匹配八项任务,共吸引2053支高校、企业和组织队伍参赛。最终,达摩院在众多参赛队伍中脱颖而出,获得文书校对和可解释类案匹配两项任务的最高分。

文书校对任务成绩榜单.jpg

文书校对任务成绩榜单

文书校对主要用于辅助司法人员检出并纠正法律文书中存在的错误,例如错别字、冗余、缺失、乱序等类型错误。此次比赛,达摩院采用了序列到编辑和序列到序列两种主流的模型结构,并且采用编辑级别投票的方式对二者进行集成,其可以尝试将错误的句子翻译成正确的句子,同时对错误位置进行插入、修改、删除等编辑动作。此外,为解决训练数据不足的问题,达摩院还采用数据增强的方法生成了大量的训练语料,有效提升模型的纠错能力,最终该模型以81.759分的成绩获得第一。

可解释类案匹配任务成绩榜单.jpg

可解释类案匹配任务成绩榜单

可解释类案匹配可以为待决案件的裁判提供参考和依据。参赛队伍需要针对系统给定的两个案件信息,来判断两个案件是“匹配”、“部分匹配”还是“不匹配”关系。达摩院基于法律特征句,构建了句-段-案件的类案匹配体系,最终判断出案件匹配程度,而其中的句子和段落则可成为类案匹配的依据,从而达到模型的可解释性。并且对案件匹配任务进行了细粒度的拆解,针对不同匹配性质选用不同文本输入,有效提升模型匹配的鲁棒性。最终总成绩为0.801,位列第一位。

目前,达摩院在法律AI领域已发表数十篇国际顶会论文,团队辅助研发的AI法官助理“小智”已在浙江省高院、黑龙江高院等法院上线应用,可将简单案件庭审效率提升50%以上,已辅助审理案件超10000件。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2023-02-03
阿里达摩院获中国法律智能技术评测两项冠军,参赛模型底座已在魔搭社区开放
2月3日消息,由最高人民法院司改办和中国中文信息学会指导的中国法律智能技术评测(CAIL 2022)于日前公布比赛结果,阿里巴巴达摩院在八项任务中获得两个冠军,是唯一获得多项第一的参赛团队。

长按扫码 阅读全文