[1]杨荣根,王 博,龚乐君.基于CRF和深度学习的病历实体识别的研究[J].南京师范大学学报(工程技术版),2022,(01):081-85.[doi:10.3969/j.issn.1672-1292.2022.01.012]
 Yang Ronggen,Wang Bo,Gong Lejun.Research on Medical Record Entity Recognition Based onCRF and Bi-LSTM-CRF[J].Journal of Nanjing Normal University(Engineering and Technology),2022,(01):081-85.[doi:10.3969/j.issn.1672-1292.2022.01.012]
点击复制

基于CRF和深度学习的病历实体识别的研究
分享到:

南京师范大学学报(工程技术版)[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2022年01期
页码:
081-85
栏目:
机器学习
出版日期:
2022-03-15

文章信息/Info

Title:
Research on Medical Record Entity Recognition Based onCRF and Bi-LSTM-CRF
文章编号:
1672-1292(2022)01-0081-05
作者:
杨荣根1王 博2龚乐君2
(1.金陵科技学院智能科学与控制工程学院,江苏 南京 211169)(2.南京邮电大学江苏省大数据安全与智能处理重点实验室,江苏 南京 210023)
Author(s):
Yang Ronggen1Wang Bo2Gong Lejun2
(1.College of Intelligent Science and Control Engineering,Jinling Institute of Technology,Nanjing 211169,China)(2.Big Data Security and Intelligent Processing Key Laboratory of Jiangsu Province,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)
关键词:
电子病历命名实体抽取条件随机场特征模板双向长短时记忆网络
Keywords:
electronic medical recordnamed entity extractionconditional random fieldfeature templatebidirectional long-term short-term memory network
分类号:
TP391
DOI:
10.3969/j.issn.1672-1292.2022.01.012
文献标志码:
A
摘要:
随着电子病历数据量的快速增长,如何深层次、高效率地利用电子病历资源成为越来越迫切需要解决的问题. 从真实病历出发,研究电子病历的医学实体识别问题,为计算机更好地辅助医疗奠定基础. 通过人工标注的108份心血管科的真实病历数据与3类特征模板,运用条件随机场和双向长短时记忆网络联合条件随机场对心血管科电子病历疾病命名实体抽取的实验,并进行比较分析. 结果表明,结合合适的特征模版,条件随机场模型有更好的抽取性能,是一种较为适用的病历命名实体抽取方法.
Abstract:
With the rapid increase in the amount of electronic medical record data,how to use electronic medical record resources in depth and efficiency has become more and more important. This article starts from the real medical record,through the manual annotation of 108 medical records of real medical records and three types of feature templates,using conditional random field and the bidirectional long-term short-term memory network conditional random field. Experiments on the extraction of cardiovascular electronic disease named entities and comparative analysis are conducted. The results show that CRF has better extraction performance,and that it is a more suitable method for extracting medical record named entities for small-scale and partially formatted medical record texts.

参考文献/References:

[1] DICK R S,STEEN E B,DETMER D E. The computer-based patient record:an essential technology for health care[M]. Washington DC:National Academy Press,1997.
[2]李彬. 电子病历的应用现状及发展对策初探[J]. 医学与社会,2005,18(6):46-49.
[3]李丽双,何红磊,刘珊珊,等. 基于词表示方法的生物医学命名实体识别[J]. 小型微型计算机系统,2016,37(2):302-307.
[4]NADEAU D,SEKINE S. A survey of named entity recognition and classification[J]. Lingvisticae Investigationes,2007,30(1):3-26.
[5]TONG F,LUO Z H,ZHAO D S. A deep network based integrated model for disease named entity recognition[C]//Proceedings of IEEE International Conference on Bioinformatics and Biomedicine. Washington DC:IEEE Computer Society,2017:618-621.
[6]李莹. 文本病历信息抽取方法研究[D]. 杭州:浙江大学,2009.
[7]栗伟. 电子病历文本挖掘关键模型研究[D]. 沈阳:东北大学,2014.
[8]LEI J,TANG B,LU X,et al. A comprehensive study of named entity recognition in Chinese clinical text[J]. Journal of the American Medical Informatics Association,2014,21(5):808-814.
[9]张晓斌. 基于 CNN 和双向 LSTM 融合的实体关系抽取[J]. 网络与信息安全学报,2018,4(9):44-51.
[10]杨红梅. 基于双向LSTM神经网络电子病历命名实体的识别模型[J]. 中国组织工程研究研究,2018,32(4):1082-1086.
[11]曹春萍. 基于E-CNN 和BLSTM-CRF的临床文本命名实体识别[J]. 计算机应用研究,2019,36(12):3748-3751.
[12]栗伟. CRF与规则相结合的医学病历实体识别[J]. 计算机应用研究,2015,22(20):3237-3242.
[13]李航. 统计学习方法[M]. 北京:清华大学出版社,2012.
[14]刘凯. 基于条件随机场的中医临床病历命名实体抽取[J]. 计算机工程,2014,40(9):312-316.
[15]柏兵. 基于CRF和BI-LSTM的命名实体识别方法[J]. 中国信息科技大学学报,2018,33(6):27-33.
[16]陈彦妤. 基于CRF和Bi-LSTM的保险名称实体识别[J]. 智能计算机与应用,2018,8(3):112-114.
[17]金宸. 基于双向LSTM神经网络模型的中文分词[J]. 中文信息学报,2018,32(2):29-37.

备注/Memo

备注/Memo:
收稿日期:2021-08-31.
通讯作者:杨荣根,博士,副教授,研究方向:学习理论、人工智能信息处理. E-mail:rg4592@jit.edu.cn
更新日期/Last Update: 2022-03-15