王晰,柯丽娟,李海燕,等.基于“深度学习模型+词典”的针刺效应命名实体识别研究[J].世界科学技术-中医药现代化,2024,26(07):1779-1785.
摘要:目的 基于针刺RCT文献数据集,提出一种基于“深度学习模型和字典”结合的针刺效应命名实体识别方法,为构建针刺效应知识库提供技术支撑。方法 本文比较了基于word2vec、ALBERT和“ALBERT+词典”的向量表示效果,并在此基础上提出了结合领域词典的ALBERT-BiLSTM-CRF深度学习模型的命名实体抽取方法。结果 从实体抽取效果来看,“ALBERT-BiLSTM-CRF+词典”的实体识别效果最好,P值92.57%、R值91.42%、F1值91.85%,而ALBERT-BiLSTM-CRF模型的效果稍差一些,P值83.10%、R值81.14%、F1值81.98%,word2vec-BiLSTM-CRF的效果最差,P值81.82%、R值70.76%、F1值75.48%。从实体类别看,精确率最高的前三种实体为针法、刺法、针刺部位,分别为98%、97%、97%,精确率最低的三种实体为配穴对应症状、疾病名称、样本量,分别为50.00%、50.68%、52.43%。结论 “ALBERT-BiLSTMCRF+词典”模型相比于原始的ALBERT-BiLSTM-CRF模型,精准率P、召回率R和F1值都有明显提高。模型用于针刺效应命名实体识别是有效的。
关键词:BiLSTM-CRF;针灸;随机对照试验;命名实体识别
资金资助:基于本体的针刺效应知识库与智能检索系统研究;针刺镇痛效应的知识图谱构建研究