用户健康

用户健康信息学:构建面向用户的医疗信息服务平台—受用户健康信息学启发,拟建立一个面向用户的,集用户健康档案、病历管理,人性化、个性化、精确化的医疗信息检索,针对用户需求的医疗信息自动推荐,用户社区自动构建等功能于一身的综合性医疗卫生信息服务平台。研究内容包括电子病历文本词法分析(分词、词性标注、新词识别等)和句法分析,基于电子病历的用户个人健康知识的自动获取、表示、维护和应用(医疗实体识别和实体关系抽取、共指消解等),及其在移动平台的应用。

机器学习

基于适应性免疫原理的多词主体自治学习模型研究。以适应性免疫原理为理论基础,以面向自治计算的多主体复杂系统建模为建模方法,将词汇模拟为参与适应性免疫反应的细胞和分子,词汇之间的关系模拟为免疫细胞或分子的受体之间的特异性关系,关系强度为受体间的亲和度来构建免疫词主体。在适应性免疫反应中,通过在免疫词主体的交互、克隆、变异和选择行为作用下,进行免疫词主体自治学习。在不断学习作用下,达到优化词主体间特异性关系(即词汇关系)的目的。目前已在依存句法分析和情感要素分析验证了模型的有效性。

情感分析

构建博客或BBS情感倾向性分析系统。采用情感分类技术分析博客或BBS的情感倾向性。通过提取文本中的情感特征并采用最大熵模型进行情感分类。沿用此技术路线在第二届中文倾向性分析评测任务二——中文情感句识别与分类中成绩排名第一。进一步提出基于最小割的情感分类方法。该方法在第三届中文倾向性分析评测任务一——中文情感词识别中成绩排名第一。发表文章7篇,其中重要国际会议2篇。

WI 输入法

支持iPhone、iPad、iPod Touch、Android等平台的智能拼音语句输入法。它支持语句输入、智能纠错、模糊音输入、简拼输入、多种双拼输入以及点滑输入。荣获2010中国互联网最佳技术创新产品提名奖。目前用户数近百万。