成果丨思必驰在中文命名实体识别任务中取得阶段性进展

随着人工智能从感知智能向认知智能发展,语言理解和知识挖掘研究不断深入,事实和常识知识愈发重要。智能问答、对话、推理、推荐等应用均需要丰富的知识作为基础支撑,而命名实体识别作为文本中重要的知识获取手段,已成为一项重要研究课题。

命名实体识别(Named Entity Recognition,NER)任务的目标是识别出文本中预定义类别的实体。作为NLP领域的重要基础工具,其有效推动了NLP技术从实验阶段走向实用化。

近期,思必驰语言与知识团队对中文细粒度命名实体识别任务进行探索,并取得阶段性进展:在CLUE数据集Fine-Grain NER评测任务[1]中,思必驰语言与知识团队目前暂列第一。该评测数据集基于清华大学开源的文本分类数据集THUCTC[2],选出部分进行细粒度命名实体标注。原数据来源于Sina News RSS[3]。这项测评是中文自然语言处理领域的大规模赛事,有众多知名企业同台竞技。

成果丨思必驰在中文命名实体识别任务中取得阶段性进展

中文命名实体评测中的出色表现也证明了思必驰在知识挖掘方向的实力。该技术也将应用到智慧医疗综合应用中,包括从大量医疗文献、病历文本和医患对话数据中构建医疗知识图谱,并基于知识图谱辅助语义理解和知识推理,实现医疗知识问答和医疗辅助决策。如智能导诊、智能预问诊、智能诊后随访。

语言智能常被称为人工智能皇冠上的一颗明珠。在未来,思必驰语言与知识团队将继续深耕语言理解领域,打造出精准、通用且能够实现自定义的命名实体识别系统,推动命名实体识别在NLP各领域的落地和应用。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )