你好,欢迎访问语言技术研究中心 网络智能研究室官网! 今天是
我组学子在阿里天池打榜竞赛中获得第二名
时间:2021-10-18 点击数:

2021年9月28日,我组学子在由阿里主办的“天池CBLUE中文医疗NLP竞赛”打榜中力克百度、蚂蚁金融、思必驰等著名公司及北大等高校队伍,获得单项第二名,总榜第一名的好成绩。

天池CBLUE中文医疗NLP竞赛是首个中国医学语言认识评估基准,旨在构建一种关于中文医疗语言模型评估,比较和分析的相关在线平台。它以自然语言理解任务为基础,下设中文医疗实体标准化、中文医疗问答等8个子任务。涵盖命名实体识别,信息提取,临床诊断标准化,单句/句子分类等自然语言处理方面。

实验室在关毅老师的领导与华为公司的大力支持下成立了专门的竞赛小组,与华为的7支队伍一起合作开展了打榜竞赛,负责“CHIP-CDN中文医疗实体标准化”子任务。该任务会给定一个包含医疗实体的词表,对于每一条给出的医疗文本来说,需要在词表中筛选与其相关的实体或实体列表并进行输出。由于每条医疗文本所相关的实体数量不定,加之有不连续实体以及嵌套实体等情况的出现,故给本任务带来了很大的难度。我组学子从多方面进行调研并进行大量实验,最终确定了“预训练模型-多路召回-分类-得分集成学习-规则提升”的技术路线。

最终有百度的BDKG团队、蚂蚁金融的antins、思必驰的Aispeech以及北大等255支单项队伍,44支全量队伍参加了比赛。我组与华为共同组成的EIHealth-NLP队伍力克群雄,获得了8项任务均分77.231的好成绩,位列第一名;而在CHIP-CDN单项任务中,我组以F1值为75.474的成绩位列第二名。

项目组成员:关毅教授,苏嘉博士,李雪博士,叶名琛、关昌赫、侯俊屹硕士

最终排名情况如下:

版权所有:哈尔滨工业大学 计算学部 语言技术研究中心 网络智能研究室

黑龙江省哈尔滨市南岗区 西大直街92号 哈尔滨工业大学 综合楼803