首页 > 其他分享 >论文阅读:融合外部知识的生成式实体关系联合抽取方法

论文阅读:融合外部知识的生成式实体关系联合抽取方法

时间:2024-05-14 16:31:52浏览次数:26  
标签:关系 编码器 抽取 实体 知识 生成式 论文 文本

祝振赫,武虹,高洁,等.融合外部知识的生成式实体关系联合抽取方法[J].计算机技术与发展,2023,33(08):124-130.

引言

  • 基于传统的机器学习的关系抽取方法主要通过领域专家制定实体关系范式,通过统计和规则等方式进行抽取。
  • 许多经典的关系抽取方法都是使用监督学习来获得较好的性能表现,因为监督学习能够更有效地让模型抽取到特征,从而提高准确率和召回率。
  • 但在特定领域,由于难以获取大规模标注数据,而通常使用基于启发式规则的无监督方法和远程监督等半监督方法。

相关工作

  • 关系抽取任务从领域上可分为限定域关系抽取(事先确定关系类别)和开放域关系抽取(直接从原文中抽取关系),其区别在于是否对关系类别进行制定。
  • 基于深度学习的关系抽取方法主要分为流水线式抽取方法和联合式抽取方法两种。
    • 流水线式方法一般是先对文本进行命名实体识别,找出文本中所有的命名实体,然后再将这些命名实体两两配对进行关系分类。(适用于限定域;其关系预测阶段是个多分类任务;可能存在传播误差)
    • 联合抽取方法是同时完成实体和实体间关系的抽取任务,通过利用实体和关系的关联信息来提高模型性能。

关系抽取方法的整体架构

  • 该文所面对的从网页文本中抽取所有可能实体关系这一任务的整体架构如图1所示。

多源关系抽取模型结构

  • 基础模型选用经典的seq2seq模型transformer。
  • 在transformer原有的编码器上增加一个知识编码器,同样使用自注意力机制对引入的知识进行编码,从而获得文本中的局部知识信息。
  • 将文本编码和知识编码一同送入解码器中。在解码器增加一个解码知识的注意力层,用于解码出更类似引入知识的三元组,从而达到对知识的学习。
  • 知识提取器:通过使用规则从文本中抽取实体关系元组以及根据表格信息匹配对应句子等方法获取和该句子有关的局部知识,作为输入模型的额外知识信息。
  • 文本编码器:输入为句子X,通过词嵌入和位置编码操作后得到句子嵌入Ex,再输入文本编码器后得到输入句子的上下文向量Hx。
  • 知识编码器:对知识提取器得到的和句子相关的知识进行特殊标记处理拼接后形成知识序列K,通过词嵌入和位置编码操作得到知识嵌入Ek。输入知识编码器后得到知识的上下文向量Hk。
  • 解码器:在解码阶段首先将目标三元组序列T作为解码器的输入,同样经过词嵌入和位置编码后得到目标元组序列嵌入ET。在注意力层将ET经过自注意力机制得到的目标序列隐层状态HT,先后与Hx和Hk计算交叉注意力,得到融合知识后的解码器输出的隐藏层状态Ho。将Ho经过线形层和softmax计算得到输出单词的概率P。

训练方式

  • 首先使用纯文本和所有抽取出的实体关系三元组作为编码器和解码器的输入单独训练一个Transformer模型,并在训练好之后将各层参数固定。再用纯文本和部分抽取实体作为模型编码器输入,所有实体关系三元组作为解码器输入进行训练,训练过程中仅更新知识编码器以及目标三元组和知识交叉注意力模块的参数。

目标函数

  • 根据给定输入句子X、外部知识K以及用标注数据训练得到的Transformer参数θX来生成目标序列Y,采用最大似然估计,提升真实样本Y的似然概率。

实验部分

  • 数据集:
    • 通用百科领域的数据集SpanSAOKE,该数据集是中文开放域信息抽取的大规模句子级数据集,其中每个句子都是人工标记的,并采用统一的知识表示格式来表达句子中所包含的事实。
    • 另一个是采招网上的标书网页文本共获取了20951篇。 根据需求及对标书格式的认知制定一系列规则对标书内容进行抽取,实体类别包括招标方名称、供应商名称、招标代理机构名称、预算金额、产品名称等24种类别。
  • 评价指标:
    • 实验使用F1值作为评价指标,并采用涂飞明等人在实验中所用的两种计算方式。
    • 完全匹配:(精确匹配度)对于抽取出的关系三元组,只有当预测的头实体、尾实体及实体间关系完全和标准答案相同时才算是一个正确的抽取结果。
    • 最长公共子串:(模糊匹配度)首先得到预测结果与标准答案的最长公共子串(LCS),根据LCS的长度和标准答案的长度计算召回率(R),根据LCS的长度和预测结果的长度计算精确率(P),再由R和P计算F1,如公式,然后同样取全部数据均值。

标签:关系,编码器,抽取,实体,知识,生成式,论文,文本
From: https://www.cnblogs.com/zinger/p/18191560

相关文章

  • Photoshop AI生成式填充工具,PS AI怎么用,怎么注册升级PS AI账号?
    Adobe发布全新生成式人工智慧功能——生成式扩展(GenerativeExpand),推进Photoshop的生成式AI功能发展更上一层楼。老牌的PS也加入到AI浪潮中,推出了一个相当炸裂的AI功能。PSAI能用来做什么这是一款功能强大且使用方便的图像处理软件,它采用了AdobeFirefly提供的AI绘图技术,可以......
  • KAN: Kolmogorov–Arnold Networks 学术论文全译
    KAN:Kolmogorov–ArnoldNetworks学术论文全译来源 https://zhuanlan.zhihu.com/p/696001648 KAN:Kolmogorov–ArnoldNetworks https://arxiv.org/pdf/2404.19756讨论Applicationaspects:WehavepresentedsomepreliminaryevidencesthatKANsaremoreeffective......
  • 论文阅读:基于长句简化的中文开放关系抽取
    熊建华,韩永国,廖竞,寇露彦,吴昌述.基于长句简化的中文开放关系抽取[J].计算机技术与发展,2023,33(02):203-207+213.目前中文开放关系抽取存在的问题:目前中文开放关系抽取的主要方法都是基于规则和模板的,这些方法需要以自然语言处理工具的处理结果为基础进行抽取。然而自然语......
  • YOLOv9改进 | 一文带你了解全新的SOTA模型YOLOv9(论文阅读笔记,效果完爆YOLOv8)
    https://snu77.blog.csdn.net/article/details/136230391 官方论文地址:官方论文地址点击即可跳转官方代码地址:官方代码地址点击即可跳转    图1.在MSCOCO数据集上实时对象检测器的比较。基于GELAN和PGI的对象检测方法在对象检测性能方面超越了所有以前的从头开始训练......
  • 论文推荐:用多词元预测法提高模型效率与速度
    这是4月发表的论文《Better&FasterLargeLanguageModelsviaMulti-tokenPrediction》,作者们提出了一种创新的多词元预测方法,该方法在提高大型语言模型(LLMs)的样本效率和推理速度方面展示了显著优势。本文将对该论文进行详细的推荐和分析,探讨其理论贡献、实验设计以及对未来研......
  • DirectAU论文阅读笔记
    TowardsRepresentationAlignmentandUniformityinCollaborativeFiltering论文阅读笔记Abstract现存的问题:​ 现有的研究主要集中在设计更强大的编码器(如图神经网络)来学习更好的表示。然而,很少有人努力致力于研究CF中表示的期望属性,这对于理解现有CF方法的基本原理和设计......
  • 推荐几款AI写作工具:智能在线一键文章创作、代码编写、论文等
    在五一节的休假期结束之后,广大员工常常体验到了显著的疲劳,对立即恢复工作状态感到抗拒。虽然这种心态在职场中并不罕见,但工作的责任与需求仍需要我们去面对。在这种背景下,如何能够既保证工作效率与质量,又能为自己争取到宝贵的调整时间,成为了许多人士所关心的问题。确实,在长假过后......
  • 利用生成式AI重新构想ITSM的未来
    对注入AI的生成式ITSM的需求,在2023年Gartner®AI炒作周期中,生成式AI达到预期值达到顶峰后,三分之二的企业已经将生成式AI集成到其流程中。 你问为什么这种追求?在预定义算法的驱动下,IT服务交付和管理中的现有AI应用程序仅限于提供预测或分类。另一方面,生成式AI......
  • AdaZoom: Towards Scale-Aware Large Scene Object Detection 论文解读
    《AdaZoom:TowardsScale-AwareLargeSceneObjectDetection》笔记1.研究动机1.1挑战与困难小目标检测和对象尺度差异存在挑战现有研究方法对于大场景中如此极端尺度变化的物体缺乏灵活性,缺乏对不同尺度物体的适应性。1.2解决方案构建了一个自适应缩放网络(简称AdaZoom),对......
  • Raft论文阅读笔记.18171971
    本文是对Raft论文阅读后的一些核心内容总结原论文:InSearchofanUnderstandableConsensusAlgorithm(ExtendedVersion)Raft概览Raft论文中用几个表格给出了Raft的细节概览,这里不用仔细阅读,后面学习的时候会慢慢深刻的理解这些内容server持有的状态RPC原语server规......