计算技术与自动化

云知声-中科院自动化所联合实验室在全国知识图

 

日前,第十五届全国知识图谱与语义计算大会(CCKS-2021)线上顺利召开。会上公布了CCKS-2021技术评测结果,云知声-中科院自动化所联合实验室在医疗科普知识答非所问识别赛道斩获冠军,并在面向中文电子病历的医疗实体及事件抽取赛道获得亚军以及唯一的技术创新奖。

CCKS由中国中文信息学会语言与知识计算专业委员会主办,是知识图谱、语义技术、链接数据等领域的核心会议。其中,CCKS技术评测致力于促进国内知识图谱领域的技术发展,以及学术成果与产业需求的融合和对接,而"技术创新奖"的设立,专门用于鼓励创新性技术的使用。

医疗科普知识答非所问(以下简称答非所问)是指针对问答形式的医疗科普内容,回答A和问题Q没有关联,即答案不能满足所提问题。在医疗科普内容里,一般有两种答非所问形式,一种是回答A和问题Q完全没有关联,不能回答提问的问题;第二种是回答A和问题Q有关联,但回答的方向不对,没有回答提问的问题。该任务是第一次在CCKS进行开展,旨在识别出医疗科普知识中的答非所问语句,助力医疗健康科普事业的发展。

为应对样本学习难度大以及训练数据缺乏两大核心挑战,团队提出了一个融合多策略的系统。该系统由基于对抗训练和对比学习的深度学习融合模块与基于无标注数据增强和课程学习的模块共同组成。团队成员包括夏飞、翁诣轩、夏茂晋、王强和黄金凤。指导老师是何世柱、刘康、刘升平和赵军老师。在本次评测中,该系统在官方决赛测试集上取得了F1指标0.的最高分数。

B榜(最终)成绩:

面向中文电子病历的医疗实体及事件抽取赛道要求参赛者提供一个解决方案来同时解决医疗实体识别和医疗事件抽取两个任务。其中医疗命名实体识别子任务,旨在对于给定的一组电子病历纯文本文档,识别并抽取出与医学临床相关的实体提及,并将它们归类到预定义类别,比如疾病、治疗、检查检验等;而医疗事件抽取子任务旨在给定主实体为肿瘤的电子病历文本数据,定义肿瘤事件的若干属性,如肿瘤大小,肿瘤原发部位等,识别并抽取事件及属性,进行文本结构化。

为同时解决医疗实体识别和医疗事件抽取两个任务,团队提出了基于序列标注的实体识别与事件抽取统一建模系统。此外,为了应对医疗领域标注数据稀疏的挑战,该系统集成了基于大规模预训练模型继续预训练、多粒度文本模式增强训练、半监督领域自适应训练等多种训练机制。任务参与方包括蚂蚁集团保险技术部、腾讯医疗AI实验室、腾讯天衍实验室、阿里云、浙江大学、中国科学技术大学、协和医学院等知名研究机构及高校。最终团队获得亚军以及赛道唯一技术创新奖。

答非所问技术与医疗命名实体识别和事件抽取技术作为基础技术已经应用于云知声医疗产品中。云知声智慧医疗解决方案应用智能语音识别、自然语言理解、临床知识图谱等人工智能技术,为医疗行业的各参与方提供丰富的产品和解决方案。覆盖医政医管、临床诊疗、医保管理、患者服务多个业务领域。服务于卫健委、医保局、医院管理者、医护人员、患者等多类用户。赋能医疗领域智能化建设,助力提升行业智能化水平。