
info@juzhikan.asia
韶关学院,广东韶关,512005;
摘要:本文提出一种基于LSTM-CRF模型的中文电子病历命名实体识别方法。该模型通过结合LSTM的序列建模能力和CRF的标签转移优化,有效解决了传统CRF在长距离依赖建模上的局限性。实验表明,该方法在不增加数据开销的情况下显著提升了实体识别性能,F1值达到93.4%,为临床文本分析提供了高效解决方案。 关键词:LSTM-CRF模型;临床命名体识别;电子病历 参考文献 [1]黄志恒,徐伟,余凯.(2015).用于序列标注的双向LSTM-CRF模型.arXiv预印本arXiv:1508.01991. [2]于勇,司新宇,胡成,张健.(2019).循环神经网络综述:LSTM单元与网络结构.神经计算,31(7),1235–1270. [3]Pennington,J.,Socher,R.,Manning,C.D.(2014).GloVe:基于全局统计的词向量表示.EMNLP会议论文. [4]Mikolov,T.,Chen,K.,Corrado,G.,Dean,J.(2013).向量空间中词表示的高效估计.arXiv预印本arXiv:1301.3781. [5]DeBruijn,B.,Cherry,C.,Kiritchenko,S.,Martin,J.,Zhu,X.(2011).临床信息抽取三阶段的机器学习解决方案:2010年i2b2竞赛技术综述.美国医学信息学会杂志,18(5),557–562. [6]李彦霖,宋煜,张佳豪,王栋.(2020).FLAT:基于扁平-网格Transformer的中文命名实体识别.ACL2020会议论文集. [7]邵一鸣,裘旭,黄萱菁.(2019).结合词典增强BERT与两阶段标注的中文命名实体识别.ACL2019会议论文集.