首页 > 其他分享 >GraphEdit论文阅读笔记

GraphEdit论文阅读笔记

时间:2024-05-30 15:25:10浏览次数:22  
标签:GraphEdit 模型 论文 笔记 我们 LLM mathcal 节点 结构

GraphEdit: Large Language Models for Graph Structure Learning论文阅读笔记

读一下图结构学习的论文,找找灵感

Abstract

​ 图结构学习(GSL)侧重于通过生成新的图结构来捕获图结构数据中节点之间的内在依赖性和交互作用。许多现有的GSL方法严重依赖于显式的图结构信息作为监督信号,这使得它们容易受到数据噪声和稀疏性等挑战。在这项工作中,我们提出了GraphEdit,这是一种利用大型语言模型(llm)来学习图结构数据中的复杂节点关系的方法。通过对图结构的指令调优来增强llm的推理能力,我们的目标是克服显式图结构信息的局限性,提高图结构学习的可靠性。我们的方法不仅有效地去噪噪声连接,而且从全局的角度识别节点级的依赖关系,提供了对图结构的全面理解。

Introduction

​ 在GSL中,主要关注的焦点是揭示那些可能无法从原始数据中立即识别出来的潜在关系和依赖关系。通过生成这些新的图结构,GSL使我们能够获得更全面的了解数据,从而促进各种下游任务,如节点分类。

​ 仅仅依赖于显式的图结构作为监督信号,可能会导致不准确或有偏差的表示。这些挑战需要开发更健壮的图结构学习框架,该框架能够适应和克服图结构数据中的数据缺陷的影响。

​ 鉴于前面概述的挑战,本研究旨在探索大型语言模型(llm)如何有助于对底层图结构的推理。我们介绍了我们提出的模型,GraphEdit,它是设计来有效地细化图形结构。我们的模型的目标是双重的:首先,识别和处理不相关节点之间的噪声连接,其次,揭示隐式的节点依赖关系。为了实现这些目标,我们的模型利用了与图形结构数据中的节点关联的丰富文本数据。通过整合llm的文本理解能力,特别是通过指令调优范式,我们增强了对图形结构的理解和表示。这允许我们捕获单个节点之间的隐式依赖关系,这些节点可能不会显式地编码在图结构本身中。

Preliminaries

图表示学习

​ 专注于捕获图中节点的有意义和信息丰富的表示,使图数据中复杂的关系和模式的分析和建模成为可能。然而,在现实世界的图中,有噪声和缺失的连接普遍存在,它们严重损害了现有的图表示学习方法的性能。

问题定义

​ 给定具有有噪声结构信息的观测图G =(V,A,T),我们的目标是改进图的拓扑结构。这涉及到对图数据中的噪声连接进行去噪,并揭示节点之间的隐式关系。通过细化原始的邻接矩阵A并获得一个信息更丰富的图结构\(\tilde{\mathcal{A}}\),我们可以更好地捕获底层的节点依赖关系,从而得到一个更新的图\(\tilde{\mathcal{G}}=(\mathcal{V},\tilde{\mathcal{A}})\)。这种细化过程导致了对底层图结构的更深入的理解,从而通过利用更新的图结构来提高下游任务的性能。

Method

模型的整体结构如下:

pk3c3KU.png

LLM的指令调优

​ 我们认为具有相似属性的节点往往具有更强的连接。这一概念进一步发展到基于节点之间的连接模式来探索节点之间的标签一致性。具体来说,在依赖于图结构的节点分类任务的上下文中,最优的情况包括最大化同一类内的连接,同时最小化类间的连接。在这一原则的指导下,我们的方法旨在利用大型语言模型(llm)的知识来解释节点之间的潜在依赖关系,并考虑到与单个节点相关联的文本语义。

​ 在提示创建阶段,我们在每个提示中精心地定义了两个独立的目标。第一个目标是评估节点对的标签的一致性。这一目标非常重要,因为它使语言模型能够准确地掌握所需的图形结构。第二个目标建立在标签一致性之上,涉及确定这些节点所属的特定类别。这些精心设计的提示,包括了这些双重目标,为语言模型的指令调优提供了宝贵的资源。提示词的设计如下:

pk3cYVJ.png

​ 在我们的方法中,我们使用随机抽样技术从我们的训练数据Ntrain中选择节点对(ni,nj)。这些节点对,用于调整llm,从训练集Ntrain中随机抽样,其中i和j代表两个不同的节点,k代表任何其他节点。

基于LLM的边预测器

​ 为了进一步加强我们的分析,除了原始图结构外,我们还认识到识别潜在候选边的重要性。然而,直接使用训练好的语言模型(LLM)来对整个图进行遍历和推理提出了计算上的挑战,特别是对于大型图。随着图的大小的增加,这种计算复杂度很快就变得不切实际了。为了克服这一挑战,我们建议引入轻量级边预测器,帮助 LLM 在图 G 中的节点间选择候选边。

​ 在这种方法中,我们利用之前采样的节点对作为边缘预测器的训练集。为了确保语义的一致性,我们对每个节点使用来自训练过的LLM的表示。这可以表示为:

​ \(h_i=\mathrm{LLM}(s_i),h_j=\mathrm{LLM}(s_j)\)

​ 说白了也就是用训练好的LLM来把每个节点的文本描述输入进去,输出对应的节点表示。然后预测的时候将节点对中的两个节点的表示形式连接起来,将表示输入一个预测层,获取边存在的概率\(\eta(h_i||h_j)\),然后用CE函数来进行优化。

LLM增强的结构细化

​ 为了细化图的结构,我们使用先前开发的边缘预测器,根据每个节点估计的存在可能性来识别每个节点的前k个候选边缘。这些候选边,以及图的原始边,然后通过一个prompt,由大型语言模型(LLM)进行评估,如表1所示。LLM利用这些信息来确定哪些边应该被合并到最终的图结构中。图结构细化过程总结如下:

\(\begin{aligned}&\mathcal{A}^{\prime}=\text{EdgePredictor}(\mathcal{H}_n)+\mathcal{A},\\&\hat{\mathcal{A}}=\text{LLM}(\text{Prompt}(\mathcal{A}^{\prime}))\end{aligned}\)

​ 也就是把边预测器的输出与原始图结合,利用LLM对重构的图进行增加或删除边,这样就获取到了最终的图结构。

​ 总之,我们的框架通过合并边缘预测器的预测和利用LLM的推理能力,提高了最终图的质量和结构。这导致了隐式全局节点依赖关系的揭示和噪声连接的去噪,从而改进了图表示。

标签:GraphEdit,模型,论文,笔记,我们,LLM,mathcal,节点,结构
From: https://www.cnblogs.com/anewpro-techshare/p/18222422

相关文章

  • 提示词工程之“学位论文润色”
    提示词:-Role:资深学术编辑-Background:用户需要对中文博士学位论文中的段落进行润色,以提升论文的学术质量和表达的准确性。-Profile:你是一位经验丰富的学术编辑,擅长中文学术写作,对学术规范和论文结构有深刻理解。-Skills:中文写作能力、学术编辑、语言润色、逻辑清晰......
  • 提示词工程之“给论文起标题”
    提示词:-Role:学术研究专家和标题生成顾问-Background:用户需要一个能够根据论文摘要生成学术论文标题的系统。-Profile:你是一位经验丰富的学术编辑,擅长提炼关键信息并创作引人注目的学术论文标题。-Skills:学术写作、摘要分析、关键词提取、创造性思维。-Goals:设......
  • Java学习笔记(三)
    Java学习笔记(三)对象和类对象:对象是类的一个实例(对象不是找个女朋友),有状态和行为。例如,一条狗是一个对象,它的状态有:颜色、名字、品种;行为有:摇尾巴、叫、吃等。类:类是一个模板,它描述一类对象的行为和状态。下图中汽车为类(class),而具体的每辆车为该汽车类的对象(object),对象包含了......
  • Git使用笔记
    全局Git配置查看用户名和邮箱gitconfiguser.namegitconfiguser.email修改用户名和邮箱gitconfig--globaluser.name"username"gitconfig--globaluser.email"email"生成SSH公钥ssh-keygen-trsa-C"邮箱"重置git本地密码gitconfig--system--......
  • 数据结构学习笔记-冒泡排序
    冒泡排序的算法设计与分析问题描述:设计并分析冒泡排序算法【算法设计思想】遍历数组,从第一个元素到倒数第二个元素(因为最后一个元素不需要再比较,它已经是最大的了)。在每次遍历过程中,再次遍历未排序部分的元素(从第一个到当前未排序部分的末尾),比较相邻的两个元素,如果顺序不正确......
  • ChatGPT4的科研应用:从数据收集到论文发表的全流程
    2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在各行各业的应用呈现了更多的可能性。2023年11月......
  • 算法课程笔记——快速幂
    算法课程笔记——快速幂......
  • Java毕业设计-基于springboot开发的旅游网站-毕业论文(附毕设源代码)
    文章目录前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1、开发说明2、需求/流程分析3、系统功能结构三、系统实现展示1、用户信息管理2、旅游动态管理3、景点信息管理4、公告信息管理四、毕设内容和源代码获取总结Java毕业设计-基于springboot开发的旅游网站-......
  • django基于大数据的汽车销售可视化系统的设计与实现论文(1)
    摘要近年来,随着互联网的蓬勃发展,企事业单位对信息的管理提出了更高的要求。以传统的管理方式已无法满足现代人们的需求。为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生,随着各行业的不断发展,汽车销售可视化系统分析系统也逐渐进入了信息化的进程。这个系统的设......
  • 基于Django的蔬菜批发管理系统论文
    摘要随着现代农业和物流技术的飞速发展,蔬菜批发行业面临着巨大的市场机遇与挑战。传统的蔬菜批发管理方式已无法满足日益增长的市场需求和日益复杂的供应链环境。因此,开发一套高效、智能的蔬菜批发管理系统变得至关重要。本文旨在探讨蔬菜批发管理系统的设计与实现,为行业......