首页 > 其他分享 >论文阅读:基于实体边界组合的关系抽取方法

论文阅读:基于实体边界组合的关系抽取方法

时间:2024-05-16 20:41:00浏览次数:7  
标签:论文 边界 模型 实体 抽取 识别 句子

李昊, 陈艳平, 唐瑞雪, 等. 基于实体边界组合的关系抽取方法[J]. 计算机应用, 2022, 42(6): 1796.

主要工作

  • 提出了一种边界组合的关系抽取方法,跳过实体直接使用实体边界进行关系抽取;
  • 本文方法结合了Chen等提出的多通道深度神经网络模型思想以及特征组合的方法以减轻错误扩散对关系抽取的影响;
  • ACE 2005英文数据集上验证了该方法的宏平均F1值优于表格-序列编码器方法。

模型

  • 本文中关系抽取分为两个阶段,分别为边界识别阶段关系抽取阶段
    • 其中,边界识别阶段用边界识别模型来识别实体边界;
    • 关系抽取阶段利用边界识别模型识别出来的实体边界通过关系抽取模型识别实体间的关系。

边界识别模型

  • 在边界识别阶段,本文根据Chen等提出的一种基于深度边界组合的嵌套命名实体识别模型的方法采用两个双向长短期记忆条件随机场模型分别识别实体的开始边界和结束边界,它们均由字嵌入层Bi-LSTM层CRF层组成。
  • Embedding层中本文通过BERT预训练技术将每个字转化为低维稠密向量。
  • Bi-LSTM层,为了捕获上下文信息,本文利用了其可长度依赖和避免梯度消失或爆炸的能力。
  • 最后在CRF层,本文在此获取最大概率转移路径,从而得到识别出来的实体边界以及实体类型。

关系抽取模型

  • 在本文中,给定句子S,当句子中存在两个及以上不同实体的开始边界或结束边界时,通过将不同实体的开始边界或结束边界组合成实体边界对进行关系抽取。
  • 本文方法的网络模型架构如图2所示,通过实体边界组合将句子划分作为模型的输入生成句向量,经过卷积层最大池化层,将输出的最大池化层的结果与特征元素生成的特征向量进行拼接输入全连接层,最后通过softmax函数得到最终的关系结果。

实体边界组合

  • 该部分是通过CNN模型构建句子分布式表示。当单个句子中有不少于一个实体时,就能够以不同实体的开始边界(或结束边界)两两组合生成实体边界对。
  • 利用两个实体的开始边界或结束边界将每个句子分为三个部分Si={L,M,R}
    • L 代表处于实体一开始边界或结束边界左边的句子部分;
    • M 代表处于实体一开始边界和实体二开始边界或结束边界中间的句子部分;
    • R 代表处于实体二开始边界或结束边界右边的句子部分。
  • 将划分后的句子中的字通过字嵌入表示为向量,作为卷积层的输入。
  • 在卷积层中将从输入矩阵中抽取不同尺度的序列信息,而为了抽取到的序列信息的尺寸不同,会设置不同窗口大小的Filter
  • 然后,在最大池化层,将每个Filter向量取最大值,以此来捕获最重要的特征。

特征组合

  • 该部分是利用特征组合方法生成带有句子结构信息的复合特征。
  • 设特征函数TypeOf(xe*)代表获取xe的类型,xe代表一个句子中的任意单个实体。
  • 特征函数PositionOf(xe1, xe2)代表获取xe1和xe2两个实体之间的位置结构信息(如前后信息)。
  • 本文将得到的特征进行分组后取得的特征集设为D = {TypeOf(xe1), TypeOf(xe2), PositionOf(xe1, xe2)}
  • 针对这些特征集可以进行特征组合,生成新的复合特征。本文采用了两种复合特征:

CNN模型

  • 假设S={w1,w2,...,wn}是一个将要作为CNN模型输入的句子,其中wi表示句子S的第i个字。
  • 因为CNN模型的输入为固定长度,所以设句子固定长度为m,如果句子过长,应将句子舍弃一部分直到长度为m;如果句子过短,则需要对句子进行填充使之长度达到m。
  • 然后将字进行嵌入
  • 在CNN模型的卷积层中,卷积运算表示为:
    • 卷积层可以被形式化为:
  • 池化层中,为了选择出信息最为丰富的特征,将会对c中的每个元素进行最大池化操作。
  • 池化层之后为全连接层,将会给出全局规则,实现表示为Wf·p的转换。
  • 最后再由softmax层输出预测类别的概率分布。
  • 总的来说,本文关系抽取模型可以被表示为:

标签:论文,边界,模型,实体,抽取,识别,句子
From: https://www.cnblogs.com/zinger/p/18196699

相关文章

  • 论文阅读:基于多通道自注意力机制的电子病历实体关系抽取
    宁尚明,滕飞,李天瑞.基于多通道自注意力机制的电子病历实体关系抽取[J].计算机学报,2020,43(5):916-929.本文的主要贡献一种更为高效的神经网络架构:recurrent+transformer。"recurrent+CNN"是当前医学文本领域实体关系抽取任务的主流建模方法,为进一步建模表征更全面......
  • 石家庄铁道大学毕业论文格式设置
    设置正文中字母与数字的格式为TimesNewRomanSubSetEnglishAndNumbersFontToTimesNewRoman()DimrngAsRangeDimdocAsDocumentDimparaAsParagraphDimiAsInteger'获取当前活动文档Setdoc=ActiveDocument'循环遍历......
  • 论文阅读:基于预训练模型的关系抽取研究综述
    ELMO模型ELMO的本质思想是通过使用针对语言模型训练好的BiLSTM来构建数据的文本表示。基于语言模型的词表示:传统的词向量表示方法(如word2vec和GloVe)将每个词映射为一个固定的向量,无法处理多义词。ELMo模型通过训练一个语言模型,将每个词的表示作为模型的隐藏状态,根据上下文来推......
  • MixGCF论文阅读笔记
    MixGCF:AnImprovedTrainingMethodforGraphNeuralNetwork-basedRecommenderSystems论文阅读笔记Abstract现存问题:​ 基于gnn的CF中的负采样在很大程度上尚未被探索。提出方法:​ 我们建议通过同时利用用户-项图结构和gnn的聚合过程来研究负抽样。我们提出了MixGCF方......
  • 【待办小工具】“工具”与“人”的明确边界感
    当前市面上有许多待办工具软件,在vivo应用商店上使用关键词“待办”可以搜索到60个左右待办工具软件,这还仅仅是一个国内的应用商店,如果在googleplay上,那数量将会比这更多。从这一数据发现,人们对移动待办工具的需求量很大,另外,待办工具这一市场已经饱和,很难在玩出新意。待办......
  • 对于论文写手来说“论文只有零篇和无数篇”
    作为一个论文写手,我应该算是很不合格了,可以说近10年也没有什么业绩了。这个期间总是由于种种事情,导致自己一直没有动手搞过文章了,后来慢慢的也就生疏了,也就愈发的搞不动了,不过吧现实情况是没有业绩就没有收入,所以现在也是无奈之下要搞搞了,这个时候就想到了网上关于论文写手的一......
  • RocSE论文阅读笔记
    TowardsRobustNeuralGraphCollaborativeFilteringviaStructureDenoisingandEmbeddingPerturbation论文阅读笔记Abstract​ 现有的鲁棒协同滤波工作主要通过去噪图结构来提高鲁棒性,而其他领域的最新进展表明,在嵌入空间中直接添加对抗性扰动可以显著提高模型的鲁棒性。......
  • 【转载】PPT上作图转化为矢量图 —— 论文写作必备技能
    原文地址:https://www.cnblogs.com/scandit/p/15112138.htmlPPT作出的图本身就为矢量图(可以插入到Word中),另存为PDF后,再通过PDF专业工具适当剪裁即可满足需求,插入到LaTex论文中将做好图的PPT文件另存为PDF文档用AcrobatPro打开转换好的PDF文档,找到:编辑PDF→剪裁页面→框......
  • RecDCL论文阅读笔记
    RecDCL:DualContrastiveLearningforRecommendation论文阅读笔记Abstract提出问题:​ 现有的基于cl的方法大多集中于批处理的对比,没有利用特征维度中潜在的规律性。这导致了在用户和项目的表示学习过程中的冗余解决方案。解决方法:​ 在这项工作中,我们研究了如何同时使用批......
  • 【论文笔记-44~】多语言实体链接
    ~20111.Cross-LanguageEntityLinking文章核心观点:本文介绍了一种新的跨语言实体链接任务,旨在将不同语言的文档中的命名实体与英文知识库中的实体描述进行匹配。作者提出了一种利用统计音译和跨语言信息检索的方法来解决这一任务,并在21种语言上进行了实验验证。实验结果显示,......