首页 > 其他分享 >基于典型相关性分析的多视图学习方法(基于半监督学习的 CCA)——基于标签传播的半监督典型相关分析(LPbSCCA)

基于典型相关性分析的多视图学习方法(基于半监督学习的 CCA)——基于标签传播的半监督典型相关分析(LPbSCCA)

时间:2024-07-08 14:56:25浏览次数:17  
标签:基于 mathbf LPbSCCA 标签 样本 视图 传播 监督 CCA

基于标签传播的半监督典型相关分析(Semi-supervised Canonical Correlation analysis based on Label Propagation, LPbSCCA)是一种结合了典型相关分析(CCA)和标签传播技术半监督学习方法,由Shen等人提出。

该方法特别适用于处理只有部分样本带有标签的多视图数据集旨在利用少量的标注信息来改善无监督数据的表示学习。

LPbSCCA的目标

LPbSCCA的目标是在两个或多个视图(数据集)之间学习一组共享的潜在表示,即使得每个数据集的潜在表示在CCA的意义上具有最大的相关性,同时利用有限的标签信息来指导学习过程,以提高表示学习的效果和分类性能。

标签传播

标签传播是一种常用的半监督学习技术,用于从少量标记样本中推断大量未标记样本的标签。

该技术基于这样的假设:如果两个样本在特征空间中很接近,那么它们很可能属于同一类别

在LPbSCCA中,Shen等人利用标签传播技术来估计未标记样本的类信息,进而辅助CCA学习。

LPbSCCA的数学框架

假设我们有两个数据集 X 1 \mathbf{X}_1 X1​ 和 X 2 \mathbf{X}_2 X2​ ,每个数据集包含 N N N 个样本,但可能有不同的特征维度 d 1 d_1 d1​ 和 d 2 d_2 d2​ 。

其中,一部分样本带有类别标签,而大部分样本是未标记的。

LPbSCCA的目标是找到两个非线性变换 f 1 ( X 1 ; θ 1 ) f_1(\mathbf{X}_1; \theta_1) f1​(X1​;θ1​) 和 f 2 ( X 2 ; θ 2 ) f_2(\mathbf{X}_2; \theta_2) f2​(X2​;θ2​) ,其中 θ 1 \theta_1 θ1​ 和 θ 2 \theta_2 θ2​ 是对应的网络参数,使得变换后的数据在CCA的意义上具有最大的相关性同时利用标签传播技术来估计未标记样本的类别信息,以指导学习过程。

LPbSCCA的损失函数

LPbSCCA的损失函数通常包含两个部分:

  1. CCA损失:用于最大化变换后数据集之间的相关性类似于DCCA中的CCA损失。
  2. 标签传播损失:用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息,通常通过构建邻接图和标签传播算法来实现。

具体的损失函数可以表示为:

L L P b S C C A = L C C A + λ L p r o p L_{LPbSCCA} = L_{CCA} + \lambda L_{prop} LLPbSCCA​=LCCA​+λLprop​

其中,

  • L C C A L_{CCA} LCCA​ 是CCA损失,用于最大化两个变换后数据集之间的相关性。
  • L p r o p L_{prop} Lprop​ 是标签传播损失,用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息。
  • λ \lambda λ 是超参数,用于平衡CCA损失和标签传播损失的贡献。

公式解析

  • X 1 \mathbf{X}_1 X1​ 和 X 2 \mathbf{X}_2 X2​ :原始输入数据集。
  • f 1 ( ⋅ ) f_1(\cdot) f1​(⋅) 和 f 2 ( ⋅ ) f_2(\cdot) f2​(⋅) :由深度神经网络实现的非线性变换函数。
  • C f 1 ( X 1 ) f 2 ( X 2 ) \mathbf{C}_{f_1(X_1)f_2(X_2)} Cf1​(X1​)f2​(X2​)​ :变换后的数据 f 1 ( X 1 ) f_1(\mathbf{X}_1) f1​(X1​) 和 f 2 ( X 2 ) f_2(\mathbf{X}_2) f2​(X2​) 之间的互协方差矩阵,用于CCA损失。
  • L p r o p L_{prop} Lprop​ :标签传播损失,基于邻接图和标签传播算法,用于估计未标记样本的类别信息。
  • λ \lambda λ :超参数,用于调节CCA损失和标签传播损失的相对重要性。

训练过程

LPbSCCA的训练过程涉及使用梯度下降或其他优化算法来最小化上述定义的损失函数。

这意味着要调整网络参数 θ 1 \theta_1 θ1​ 和 θ 2 \theta_2 θ2​ ,使得变换后的数据在CCA空间中尽可能地相关,同时利用标签传播技术来估计并利用未标记样本的类别信息,以指导表示学习。

结论

LPbSCCA提供了一种有效的框架,用于处理部分标记的多视图数据集,特别是在数据标注成本高昂或难以获取的情况下。

通过结合CCA和标签传播技术,LPbSCCA能够从有限的标注信息中学习高质量的共享表示,这对于各种实际应用场景,如图像分类、文本分类和生物信息学分析等,都有着重要的意义。

标签:基于,mathbf,LPbSCCA,标签,样本,视图,传播,监督,CCA
From: https://blog.csdn.net/weixin_50569789/article/details/140249494

相关文章

  • 人脸识别与美颜算法实战:基于Python、机器学习与深度学习
    代码和pdf书等:GitHub-guozhe1992/read引言与基础知识:介绍人脸识别与美颜算法的基本概念、应用场景以及Python编程和机器学习的基础知识。视频图像处理技术:详细讲解基于Anaconda和PyCharm的环境搭建,以及视频图像处理的基础技术,如图像读取、显示、保存和格式转换等。抖音特效......
  • javab毕业设计-基于Java的校园二手交易商城系统设计与实现,基于springboot+vue二手跳蚤
    文章目录背景介绍演示视频(进入B站观看画面更清晰):项目架构和内容获取(文末获取)部分功能展示用户前端系统管理后台项目相关文件为什么我?本章节给大家带来的是一个基于java的大学生二手交易平台系统设计与实现,可适用于校园二手交易系统,基于Java的二手交易商城系统,大学......
  • FlexibleBI基于人工智能赋能的自主可控尺寸公差质量管理工具
    在现代制造业中,车身零件的尺寸和公差管理至关重要。为了应对不断增加的质量要求和复杂的生产环境,我们推出了一款先进的尺寸公差质量管理软件。该软件结合了人工智能的强大功能,类似于市场上高端软件,却有着更高的性价比和本地化支持。FlexibleBI自主可控的国产化三坐标CMM尺寸......
  • 基于STM32设计的智能台灯(HC05蓝牙控制)179
    基于STM32设计的智能台灯(HC05蓝牙控制)(179)文章目录一、前言1.1项目介绍【1】开发背景【2】项目实现的功能【3】项目硬件模块组成1.2设计思路【1】整体设计思路【2】整体构架1.3项目开发背景【1】选题的意义【2】可行性分析【3】参考......
  • 基于Java酒店管理系统
    作者介绍:✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术:Html、Cs......
  • 基于Java电子商城
    作者介绍:✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术:Html、Cs......
  • 基于Java酒店管理系统
    作者介绍:✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术:Html、Cs......
  • 基于Go 1.19的站点模板爬虫
    创建一个基于Go1.19的站点模板爬虫涉及到几个关键步骤:初始化项目,安装必要的包,编写爬虫逻辑,以及处理和存储抓取的数据。下面是一个简单的示例,使用goquery库来解析HTML,并使用net/http来发起HTTP请求。请注意,实际部署爬虫时,需要遵守目标网站的robots.txt规则和版权政策。首先......
  • 基于SSM的学校运动会信息管理系统(有报告)。Javaee项目。ssm项目。
    演示视频:基于SSM的学校运动会信息管理系统(有报告)。Javaee项目。ssm项目。项目介绍:采用M(model)V(view)C(controller)三层体系结构,通过Spring+SpringMvc+Mybatis+Jsp+Maven来实现。MySQL数据库作为系统数据储存平台,实现了基于B/S结构的Web系统。报告截图:......
  • 基于VPLC532E开放式数控系统在五轴义齿机上的应用
    市场应用背景随着中国口腔医学的进步及人民生活质量和消费水平的提升,人们对医疗技术和服务的期望不断提高,从而推动了对高端优质口腔医疗设备和材料的需求日益增加。特别是在义齿机市场,增长主要由人口老龄化导致的牙齿脱落、牙科铣床需求的增加、对CAD/CAM牙科铣床的认识......