
info@juzhikan.asia
长江大学地球科学学院,湖北武汉,430100;
摘要:构建沉积学知识图谱对整合海量数据、揭示沉积环境、沉积物特征与地质过程的复杂关系至关重要。针对沉积学专业术语多、句子结构复杂导致实体及属性关系联合抽取困难的问题,本文提出基于SedERNIE-BiLSTM-Attention-CRF模型的三元组提取方法。该方法利用SedERNIE增强领域语义表示,结合BiLSTM捕捉文本双向依赖,引入Attention聚焦关键信息,并通过CRF全局优化实体及其属性以确保准确性;识别实体后,按潜在关系拼接相关实体对文本输入模型分类形成三元组。实验显示,该方法准确率达94.8%、召回率94.0%、F1值94.3%,优于对比模型,为高质量沉积学知识图谱构建提供了可靠技术支持。
关键词:知识图谱;沉积学领域;三元组提取;SedERNIE
参考文献
[1]刘鹏,叶帅,舒雅,等.煤矿安全知识图谱构建及智能查询方法研究[J].中文信息学报,2020,34(11):49-59.
[2]周永章,张前龙,黄永健,等.钦杭成矿带斑岩铜矿知识图谱构建及应用展望[J].地学前缘,2021,28(3):67-75.
[3]王万良.人工智能及其应用[M].高等教育出版社,2016.
[4]杜志强,李钰,张叶廷,等.自然灾害应急知识图谱构建方法研究[J].武汉大学学报(信息科学版),2020,45(9).
[5]张雪英,叶鹏,王曙,等.基于深度信念网络的地质实体识别方法[J].岩石学报,2018,34(2):343-351.
[6]杨森淇,段旭良,肖展,等.基于ERNIE+DPCNN+BiGRU的农业新闻文本分类[J].计算机应用,2023,43(5):1461-1466.
[7]齐浩,董少春,张丽丽,等.地球科学知识图谱的构建与展望[J].高校地质学报,2020,26(1):2-10.
[8]陈忠良,袁峰,李晓晖,等.基于BERT—BiLSTM—CRF模型的中文岩石描述文本命名实体与关系联合提取[J].地质论评,2022,68(2):742-750.