首页 > 其他分享 >相关文章整理记录

相关文章整理记录

时间:2024-10-22 16:51:03浏览次数:8  
标签:Clustering 记录 标签 文章 语义 https 聚类 整理 对比

  • C3: Cross-instance guided Contrastive Clustering https://arxiv.org/pdf/2211.07136v4
    提出了一种新颖的对比聚类方法,跨实例引导的对比聚类(C3),它考虑了跨样本关系以增加正对的数量,并减轻假负、噪声和异常样本对数据学习表示的影响。特别是,我们定义了一个新的损失函数,该函数使用实例级表示来识别相似的实例,并鼓励它们聚集在一起。此外,我们提出了一种新颖的加权方法,以更有效的方式选择负样本。
  • 《Deep Clustering with Diffused Sampling and Hardness-aware Self-distillation》扩散采样与难度感知自蒸馏
  • 《Nearest Neighbor Matching for Deep Clustering》 https://openaccess.thecvf.com/content/CVPR2021/papers/Dang_Nearest_Neighbor_Matching_for_Deep_Clustering_CVPR_2021_paper.pdf
    提出了一种称为最近邻匹配(NNM)的方法,从局部(批次)和全局(整体)层面匹配样本与其最近邻。具体来说,对于局部层面,我们基于批次嵌入特征匹配最近邻,对于全局层面,我们从整体嵌入特征中匹配邻居。为了保持邻居和类别在聚类分配中的一致性,我们为局部和全局层面都构建了一致性损失和类别对比损失。
  • 《SPICE: Semantic Pseudo-Labeling for Image Clustering》 https://arxiv.org/pdf/2103.09382v3
    提出了一个基于语义伪标签的图像聚类框架(简称SPICE),该框架将聚类网络分为用于测量实例级相似性的特征模型和用于识别聚类级差异的聚类头。我们设计了两种语义感知的伪标签算法,原型伪标签和可靠伪标签,它们能够在聚类上实现准确和可靠的自监督。
  • 《You Never Cluster Alone》 https://arxiv.org/pdf/2106.01908v3
    在本文中,我们将主流的对比学习范式扩展到聚类级方案,其中所有受到相同聚类影响的数据都有助于统一表示,该表示编码了每个数据组的上下文。使用这种表示的对比学习随后奖励每个数据点的分配。
  • 《Twin Contrastive Learning for Online Clustering》 https://link.springer.com/content/pdf/10.1007/s11263-022-01639-z.pdf
    本文提出了通过在实例和聚类级别进行双对比学习(TCL)来执行在线聚类的方法。具体来说,我们发现当数据被投影到目标聚类数量的维度特征空间时,其特征矩阵的行和列分别对应于实例和聚类表示。基于这一观察,对于给定的数据集,所提出的TCL首先通过数据增强构建正负对。此后,在特征矩阵的行和列空间中,实例级和聚类级对比学习分别通过拉近正对和推开负对来进行。为了减轻内在假负对的影响并纠正聚类分配,我们采用了基于置信度的标准来选择伪标签,以增强实例级和聚类级对比学习。
  • 《Contrastive Hierarchical Clustering》
    在本文中,我们介绍了CoHiClust,这是一款基于深度神经网络的对比分层聚类模型,可以应用于典型的图像数据。通过采用自监督学习方法,CoHiClust能够在不访问任何标记数据的情况下将基础网络蒸馏成二叉树。
  • 《Semantic-enhanced Image Clustering》 https://ojs.aaai.org/index.php/AAAI/article/view/25841
    只是根据图像特征探索图像并揭示聚类,因此无法区分视觉上相似但语义上不同的图像。在本文中,我们提出在视觉-语言预训练模型的帮助下研究图像聚类任务。与零样本设置(其中已知类别名称)不同,在这种设置中,我们只知道聚类的数量。因此,如何将图像映射到适当的语义空间,以及如何从图像和语义空间对图像进行聚类,是两个关键问题。为了解决上述问题,我们提出了一种由视觉-语言预训练模型CLIP指导的新颖图像聚类方法,名为语义增强图像聚类(Semantic-Enhanced Image Clustering,简称SIC)。在这种新方法中,我们首先提出了一种将给定图像映射到适当语义空间的方法,并根据图像与语义之间的关系高效生成伪标签的方法。最后,我们提出在图像空间和语义空间中都进行一致性学习的聚类,以自监督学习的方式进行。
  • 《Deep Semantic Clustering by Partition Confidence Maximisation》 https://openaccess.thecvf.com/content_CVPR_2020/papers/Huang_Deep_Semantic_Clustering_by_Partition_Confidence_Maximisation_CVPR_2020_paper.pdf
    现有的深度聚类方法通常依赖于基于样本间关系和/或自估计伪标签的局部学习约束。这容易受到邻域中不可避免的错误的影响,并在训练过程中遭受错误传播的困扰。在这项工作中,我们提出通过从所有可能的分离中学习最有信心的聚类解决方案来解决这个问题,这是基于将来自相同语义类别的样本分配到不同聚类会降低聚类内紧凑性和聚类间多样性,即降低分割信心的观察。具体来说,我们引入了一种名为PartItion Confidence mAximisation(PICA)的新型深度聚类方法。它建立在学习最语义上合理的数据分离的想法之上,通过最大化聚类解决方案的“全局”分割信心,将所有聚类映射到一对一的地面真实类别。
  • 《Clustering by Maximizing Mutual Information Across Views》 https://openaccess.thecvf.com/content/ICCV2021/papers/Do_Clustering_by_Maximizing_Mutual_Information_Across_Views_ICCV_2021_paper.pdf
    我们的方法由两个共享相同主干网络的头组成——一个“表示学习”头和一个“聚类”头。“表示学习”头捕获实例级别物体的细粒度模式,这些模式作为“聚类”头的线索,以提取将物体分离成簇的粗粒度信息。整个模型通过最小化两个面向样本的对比损失的加权和来端到端训练,这两个对比损失应用于两个头的输出。为确保与“聚类”头对应的对比损失是最优的,我们引入了一种名为“log-of-dot-product”的新颖批评函数。
  • 《Towards Efficient and Effective Deep Clustering with Dynamic Grouping and Prototype Aggregation》
    https://arxiv.org/pdf/2401.13581v1
    以前的对比性深度聚类方法大多关注实例级信息,而忽略了组/集群内的成员关系,这可能会严重破坏它们的表示学习和聚类能力。最近,已经开发了一些组对比方法,然而,这些方法通常依赖于整个数据集的样本来获得伪标签,并且缺乏以批量方式有效地更新组分配的能力。为了解决这些关键问题,我们提出了一种新颖的端到端深度集群框架,该框架具有动态分组和原型聚合功能,称为 DigPro。具体来说,所提出的动态分组将对比学习从实例级别扩展到组级别,这对于及时更新组是有效的。同时,我们在球形特征空间中对原型进行对比学习,称为原型聚合,旨在最大化集群间距离。
  • 《Towards Efficient and Effective Deep Clustering with Dynamic Grouping and Prototype Aggregation》 https://arxiv.org/pdf/2105.01899
    提出了对比专家混合(MiCE),这是一个统一的概率聚类框架,它同时利用了对比学习学到的区分性表示和潜在混合模型捕获的语义结构。受专家混合的启发,MiCE使用一个门控函数根据潜在语义将未标记的数据集划分为子集,并且使用多个专家以对比学习的方式区分分配给他们的不同实例子集。
  • 《RPSC: Robust Pseudo-Labeling for Semantic Clustering》 https://ojs.aaai.org/index.php/AAAI/article/view/29309
    他们没有考虑伪标签的置信度,伪标签不是最优的监督信息,导致错误积累。为了解决这个问题,我们提出了一种用于语义聚类的稳健伪标记 (RPSC) 方法,该方法包括两个阶段。在第一阶段 (RPSC-Self),我们利用样本的一致性设计了一个语义伪标记方案,即具有相同语义的样本在嵌入空间中应该彼此靠近。为了利用稳健的语义伪标签进行自我监督学习,我们提出了一种软对比损失 (SCL),它鼓励模型相信高置信度的语义伪标签,并减少受低置信度伪标签的驱动。在第二阶段 (RPSC-Semi),我们首先根据样本自身与聚类中心之间的距离来确定样本的语义伪标签,然后利用一致性筛选出可靠的语义伪标签。这些可靠的伪标签在伪半监督学习算法中用作监督信息,以进一步提高性能。
  • 《Dual Mutual Information Constraints for Discriminative Clustering》 https://ojs.aaai.org/index.php/AAAI/article/view/26032
    在以往的研究中,大多数深度聚类方法都遵循自监督表示学习的理念,通过最大化所有相似实例对的一致性来实现,同时忽略了特征冗余对聚类性能的影响。为了解决上述问题,我们设计了一种名为DMICC的双重互信息约束聚类方法,该方法基于深度对比聚类架构,特别采用了具有坚实理论保证和实验验证的双重互信息约束。具体来说,在特征层面,我们通过最小化所有维度间的互信息来减少特征间的冗余,鼓励神经网络提取更具辨识力的特征。在实例层面,我们最大化相似实例对的互信息,以获得更无偏和鲁棒的表示。双重互信息约束同时发生,因此相互补充,共同优化更适合聚类任务的特征。

标签:Clustering,记录,标签,文章,语义,https,聚类,整理,对比
From: https://www.cnblogs.com/wtbhs/p/18492272

相关文章

  • css中,我想把文章的第一行设置单独的样式
    背景:我想把文章的第一行设置单独的样式。方式1:我把第一行单独用一个p标签包裹。但是页面是响应式的,随着页面的缩放,第一行的文字被挤到第二行甚至第三行,完全不符合我的需求。于是,我思考,有没有什么css选择器,可以直接选中文章的第一行。结果还真被我找到了。/*伪元素选......
  • 2024牛客暑期多校训练营9 - VP记录
    A.ImageScaling签到题,找出举行宽高以后直接除以它们的\(\gcd\)使它们互质即可。(这道题居然会有人又WA又RE,我不说是谁)点击查看代码#include<cstdio>#include<cstring>usingnamespacestd;constintN=505;intn,m,x1,y1,x2,y2;charg[N][N];intgcd(intx,int......
  • 面试常见Java八股文整理!!!
    1.Java线程start方法和run方法的区别start方法启动了一个新的线程,而run方法不能启动一个新线程,还是在main线程下运行,程序依然是主线程一个线程在运行。调用start方法可以启动线程,而run方法只是thread的一个普通方法还是在主线程中执行。通过start()方法来启动的新线程,处于就......
  • 关于selenium 最近的更新记录
    1、导入元素操作方式有所变动,故导入的内容也要变更:fromselenium.webdriver.common.byimportBy2、获取元素的语句语句:driver.find_element(By.操作方式,"值")如获取ID:driver.find_element(By.ID,"值")获取类名:driver.find_element(By.CLASS_NAME,"值")获取CSS样式:driver......
  • ChatGPT国内中文版镜像网站整理合集(2024/10/22)
    ​一、GPT中文镜像站① 镜像站收集开源项目 收集各种可以的ChatGPT镜像网站,免费的收费的。支持4o以及o1,支持MJ绘画② yixiaai.com 支持4o以及o1,支持MJ绘画③ chat.lify.vip 支持通用全模型,支持文件读取、插件、绘画、AIPPT④ AIChat 支持GPT3.5/4,4o以及MJ绘画1.什......
  • PbootCMS系统管理员点击文章评论的状态按钮提示权限不足
    1.开启后台菜单登录后台:打开浏览器,输入你的PbootCMS后台地址,登录后台管理系统。进入系统设置:在后台管理界面,进入“系统设置”->“菜单管理”。开启后台菜单:如果你还没有开启后台菜单,可以参考这篇教程:如何开启PbootCMS后台菜单。2.修改会员中心的文章评论......
  • 4、.Net 快速开发框架:JNPF - 开源项目研究文章
    JNPF(引迈信息自研的低代码应用构建平台)是一款面向IT技术人员和程序员的低代码开发工具,它通过可视化拖拽的方式,有效降低了企业应用开发成本并快速完成项目交付。JNPF开发平台基于SpringBoot/SpringCloud+Vue3的全栈开发平台,采用微服务、前后端分离架构,通过组件化、可视化......
  • 2024/10/21 日 日志 --》关于Mysql中的数据库连接池 简述笔记整理
    为了保证博客内容的连贯性,我决定把Maven内容单独开辟而不与JDBC相混。以下为数据库连接池的简单描述和笔记整理点击查看代码--数据库连接池--简介:--·数据库连接池是个容器,负责分配、管理数据库连接。--·它允许应用程序重复使用一个现有的数据库连接,而不是再重新建......
  • 10月21日记录
    下午学习了java语言继承与派生;完善了四则运算的二三四年级的代码;importjava.util.ArrayList;importjava.util.HashMap;importjava.util.List;importjava.util.Map;importjava.util.Random;importjava.util.Scanner;importjava.io.BufferedWriter;importjava.io.F......
  • 比赛记录(61~70)
    61CSP-S模拟赛441得分题目T1T2T3T4总分得分\(10\)\(0\)\(0\)\(50\)\(60\)排名:rank\(15\)。真正最最炸裂的一集。2题解由于本场都有图片题解且都较为繁琐,因此不进行总结。T1岛屿T2最短路考虑建立最短路树。既然不能走最后一条边,那么此时我们......