欢迎访问新加坡聚知刊出版有限公司官方网站
info@juzhikan.asia
基于SedERNIE-BiLSTM-Attention-CRF模型的沉积学文本三元组提取
  • ISSN:3041-0673(Print)3041-0681(Online)
  • DOI:10.69979/3041-0673.26.02.109
  • 出版频率:月刊
  • 语言:中文
  • 收录数据库:ISSN:https://portal.issn.org/ 中国知网:https://scholar.cnki.net/journal/search

基于SedERNIE-BiLSTM-Attention-CRF模型的沉积学文本三元组提取

刘晓恩

长江大学地球科学学院湖北武汉430100

摘要:构建沉积学知识图谱对整合海量数据、揭示沉积环境、沉积物特征与地质过程的复杂关系至关重要。针对沉积学专业术语多、句子结构复杂导致实体及属性关系联合抽取困难的问题,本文提出基于SedERNIE-BiLSTM-Attention-CRF模型的三元组提取方法。该方法利用SedERNIE增强领域语义表示,结合BiLSTM捕捉文本双向依赖,引入Attention聚焦关键信息,并通过CRF全局优化实体及其属性以确保准确性;识别实体后,按潜在关系拼接相关实体对文本输入模型分类形成三元组。实验显示,该方法准确率达94.8%、召回率94.0%、F1值94.3%,优于对比模型,为高质量沉积学知识图谱构建提供了可靠技术支持。

关键词:知识图谱;沉积学领域;三元组提取;SedERNIE

参考文献

[1]刘鹏,叶帅,舒雅,等.煤矿安全知识图谱构建及智能查询方法研究[J].中文信息学报,2020,34(11):49-59.

[2]周永章,张前龙,黄永健,等.钦杭成矿带斑岩铜矿知识图谱构建及应用展望[J].地学前缘,2021,28(3):67-75.

[3]王万良.人工智能及其应用[M].高等教育出版社,2016.

[4]杜志强,李钰,张叶廷,等.自然灾害应急知识图谱构建方法研究[J].武汉大学学报(信息科学版),2020,45(9).

[5]张雪英,叶鹏,王曙,等.基于深度信念网络的地质实体识别方法[J].岩石学报,2018,34(2):343-351.

[6]杨森淇,段旭良,肖展,等.基于ERNIE+DPCNN+BiGRU的农业新闻文本分类[J].计算机应用,2023,43(5):1461-1466.

[7]齐浩,董少春,张丽丽,等.地球科学知识图谱的构建与展望[J].高校地质学报,2020,26(1):2-10.

[8]陈忠良,袁峰,李晓晖,等.基于BERT—BiLSTM—CRF模型的中文岩石描述文本命名实体与关系联合提取[J].地质论评,2022,68(2):742-750.