首页 > 其他分享 >论文阅读:Improved Graph Contrastive Learning for Short Text Classification

论文阅读:Improved Graph Contrastive Learning for Short Text Classification

时间:2024-06-18 17:58:18浏览次数:8  
标签:Improved Classification Graph 矩阵 视图 单词 聚类 TD 文本

Liu Y, Huang L, Giunchiglia F, et al. Improved graph contrastive learning for short text classification[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2024, 38(17): 18716-18724.
GIFT模型的github网址

整体框架图

  • 首先,构建一个由Gw、Ge和Gp三个分量图组成的异构图。
  • 然后对每个分量图进行GCNs,分别得到更新后的节点嵌入Hw、He和Hp。
  • 同时,构建特定于文本的 TD 矩阵 Mw、Me 和 Mp,并对其进行 SVD 以获得低秩近似矩阵 Mw,r、Me,rp,r
  • 然后,通过文本表示学习模块获得 Zorg 和 Zaug。
  • 利用 Zorg 和 Zaug 改进了图形 CL,并在 Zorg 上使用约束种子 k 均值进行交叉熵损失和面向聚类的 CL。

图构建

构建一个语料库级的异构图,由单词图、实体图和词性图(POS)组成。
(1)单词图:Gw = {Vw, Xw, Aw},由短文本中的单词构成。

  • Vw:单词集
  • Xw:由预训练的Glove词向量初始化的词嵌入
  • Aw:基于文本中单词共现统计的邻接矩阵,其中每个值由逐点互信息 (PMI) 确定

(2)实体图:Ge = {Ve, Xe, Ae},由出现在知识图谱中的实体组成。

  • Ve:实体集
  • Xe:由TransE初始化的实体嵌入
  • Ae:每个实体对的余弦相似度

(3)词性图:Gp = {Vp, Xp, Ap},由POS标签组成,指定单词的句法角色以帮助消除歧义。

  • Vp:POS标签集
  • Xp:由 one-hot 向量初始化的标签节点特征
  • Ap:由 PMI 计算的相关邻接矩阵

文本表示学习

构建异构图后,使用GNN进行编码,以同时利用拓扑和特征信息。具体采用图卷积网络(GCN)。

为了推导文本嵌入,为每种类型的节点(单词、实体和POS标签)构建特定于文本的矩阵(即TD矩阵),以在文本和节点之间建立连接。

  • 对于单词(Mw)或POS标签(Mp),使用TF-IDF值
  • 对于实体(Me),如果第i个文本包含第j个实体,Me = 1,否则为0。
    将上述信息进行聚合操作得到Zorg。

改进的图对比学习

现有的生成增强文本视图的方法往往会丢失重要的语义或引入噪音,从而误导 CL 学习过程。为此,该模型对每种节点类型的TD矩阵进行SVD矩阵分解,以减少和去噪。

  • 优点1:在减少噪声共现信号的同时,增强了文本表示的突出且可信的TD共现信号
  • 优点2:通过整合来自每个TD对的全局TD共现信号,解决了由有限的局部TD共现信号引起的语义歧义问题
    然后,在低秩近似矩阵上应用一种信息聚合机制来生成文本的增强视图(Zaug)。
生成增强文本视图
生成增强文本视图通常指的是通过某种方法改变原始文本数据,以创造新的文本"视图"。这种方法可能包括同义词替换、句子重写、文本摘要等,目的是从不同角度或不同语义层面表现原文本,以便用于训练机器学习模型,特别是在需要模型理解和处理多种表述或语义的场景中。
SVD是一种在机器学习和信号处理中常用的矩阵分解技术。它可以将任意一个复杂的矩阵分解为三个简单的矩阵(U、Σ和V^T),从而提取出数据中最重要的特征。
进行SVD分解并使用其结果可以有效减少噪音,因为通过选择最大的奇异值来重构矩阵,可以忽略那些较小的奇异值所对应的成分,这些通常包含了噪声或不重要的信息。

面向集群的对比学习

上述方法忽略了数据中涉及的聚类友好信息,并独立的对待每个实体,导致具有相似语义的假阳性对。
解决方案:

  • 使用 k-means 算法,将弱label分配给语料库中的未标记文本,以探索可以帮助模型获得更具区分性的类边界的聚类友好特征。
  • 与传统的 k-means 不同,在质心初始化阶段,不是从数据中随机选择k个样本作为初始质心,而是使用具有相同label的种子样本来形成初始聚类,然后将聚类内的向量平均为初始质心。
  • 在结论更新阶段,只更新非种子样本的聚类分配,在所有迭代中保持种子样本的聚类分配固定。

标签:Improved,Classification,Graph,矩阵,视图,单词,聚类,TD,文本
From: https://www.cnblogs.com/zinger/p/18254820

相关文章

  • Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
    检索增强生成(RAG:RetrievalAugmentedGeneration)技术旨在把信息检索与大模型结合,以缓解大模型推理“幻觉”的问题。近来关于RAG的研究如火如荼,支持RAG的开源框架也层出不穷,并孕育了大量专业领域的AI工程应用。我们设计了一个通用的开源RAG框架,以兼容未来多样化的基础研究建设和工......
  • C. Lexicographically Largest
    原题链接题解1.第\(i\)个位置上的数,对\(S\)的贡献最大不会超过\(a_i+i\),我们令其为\(c_i\)2.我们不去细想如何操作才能得到最优解,而是去想第一大的\(b\)是多少?第二大的\(b\)是多少?3.对\(c_i\)降序排序得到\(b_i\),如果所有\(b_i\)都不同,那么直接输出即可。4.但......
  • Structure-Aware Transformer for Graph Representation Learning
    目录概SAT代码ChenD.,O'BrayL.andBorgwardtK.Structure-awaretransformerforgraphrepresentationlearning.ICML,2022.概Graph+Transformer+修改attention机制.SATTransformer最重要的就是attention机制:\[\text{Attn}(x_v)=\sum_{v\in......
  • 【高光谱遥感分类论文解读1】Hyperspectral Image Classification Using Group-Aware
    目录一、论文基本信息二、研究背景三、研究方法1.GAHT总体框架2.GPE模块3.Transformer编码模块四、实验本文是博主对原论文的解读,仅代表博主个人观点,欢迎在评论区和我交流~其中,本博文中的图片和公式均来源于原论文,如需进一步了解,请查看原论文。一、论文基本信息......
  • 妙用OSGraph:发掘GitHub知识图谱上的开源故事
    1.何为OSGraph?OSGraph(OpenSourceGraph)是一个开源图谱关系洞察工具,基于GitHub开源数据全域图谱,实现开发者行为、项目社区生态的分析洞察。可以为开发者、项目Owner、开源布道师、社区运营等提供简洁直观的开源数据视图,帮助你和你的项目制作专属的开源名片、寻求契合的开发......
  • GraphQL的优势和开发模式
    当下,前后端分离是互联网应用程序开发的主流做法,如何设计合理且高效的前后端交互WebAPI是前端和后台开发人员日常开发工作的一大难点和痛点。回想我们在日常开发过程中经常会碰到的几个场景:后台开发人员调整了返回值的类型和数量而没有通知到前端后台开发人员修改了某一个字段......
  • Connected Graph
    $\quad$我在题库做题时被一道计数类DP的高精度恶心到了。本着能不打高精就不打的原则,我就用了\(long\\\\double\)来解决这个问题。$\quad$但毕竟是浮点类型的,勾石精度真的很逆天。试了很久决定写\(Python\)(doge)。$\quad$就直接去学\(Python\)了,然后发现还是有丢......
  • Personalized Subgraph Federated Learning,FED-PUB,2023,ICML 2023
    个性化子图联邦学习paper:PersonalizedSubgraphFederatedLearningcodeAbstract更大的全局图的子图可能分布在多个设备上,并且由于隐私限制只能在本地访问,尽管子图之间可能存在链接。最近提出的子图联邦学习(FL)方法通过在局部子图上分布式训练图神经网络(gnn)来处理局......
  • Summary:《Adversarial Machine Learning in Image Classification: A Survey Towards
    Note“TaxonomyofAdversarialImages”(Machado等,2023,p.5)(pdf)扰动范围(PerturbationScope):个体扰动(Individual-scopedperturbations):为每个输入图像单独生成的扰动。通用扰动(Universal-scopedperturbations):独立于任何输入样本生成的扰动,可应用于任何合......
  • E - Reachability in Functional Graph
    E-ReachabilityinFunctionalGraphhttps://atcoder.jp/contests/abc357/tasks/abc357_e 思路概念:基环树-内生树。https://www.cnblogs.com/Dfkuaid-210/p/14696378.html方法:使用拓扑排序,从入度为0的点开始,依此从外层向内层拆点,直到剩下环,拆换过程中把拆掉的size记到......