基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——代价敏感的半监督典型相关分析（CS3CCA）

时间：2024-07-08 14:56:46浏览次数：16

代价敏感的半监督典型相关分析（Cost Sensitive Semi-Supervised Canonical Correlation Analysis, CS3CCA）是一种专门设计用于处理不平衡数据和半监督学习场景下的多视图数据分析方法。

这种方法由Wan等人提出，其核心是通过引入代价敏感学习和软标签推断策略，以优化在不平衡数据集上的表现，并充分利用有限的标注信息来增强学习模型。

CS3CCA的目标

CS3CCA的目标是在两个或多个视图（数据集）之间学习一组共享的潜在表示，即使得每个数据集的潜在表示在CCA的意义上具有最大的相关性。

同时，它通过代价敏感学习来应对数据集中的类不平衡问题，并利用软标签推断策略来利用未标注数据的潜在信息，以提升模型的整体性能。

成本敏感学习

在成本敏感学习中，不同的错误类型（如假阳性与假阴性）可能会有不同的惩罚成本。

在不平衡数据集中，少数类别的误分类往往比多数类别的误分类更加严重。

因此，CS3CCA通过调整不同类别的误分类成本，来优化模型在不平衡数据集上的性能。

软标签推断

软标签推断策略是指在半监督学习场景下，通过模型预测或某种概率推断方法为未标注数据生成“软”标签（即概率分布），并将其作为额外的信息来指导模型训练。在CS3CCA中，软标签推断有助于充分利用未标注数据的潜在结构信息，从而提升模型的泛化能力。

CS3CCA的数学框架

假设我们有两个数据集 X 1 \mathbf{X}_1 X1 和 X 2 \mathbf{X}_2 X2 ，每个数据集包含 N N N 个样本，可能有不同的特征维度。

其中，一部分样本带有类别标签，而大部分样本是未标记的。CS3CCA的目标是找到两个非线性变换 f 1 ( X 1 ; θ 1 ) f_1(\mathbf{X}_1; \theta_1) f1(X1;θ1) 和 f 2 ( X 2 ; θ 2 ) f_2(\mathbf{X}_2; \theta_2) f2(X2;θ2) ，使得变换后的数据在CCA的意义上具有最大的相关性，同时利用成本敏感学习和软标签推断策略来优化模型在不平衡数据和未标注数据上的性能。

CS3CCA的损失函数

CS3CCA的损失函数通常包含三个部分：

CCA损失：用于最大化变换后数据集之间的相关性，类似于DCCA中的CCA损失。
成本敏感分类损失：用于处理数据集中的类不平衡问题，通过调整不同类别的误分类成本来优化模型性能。
软标签推断损失：用于利用未标注数据的潜在信息，通过生成软标签来指导模型训练。

具体的损失函数可以表示为：

L C S 3 C C A = L C C A + λ 1 L c o s t − s e n s i t i v e + λ 2 L s o f t − l a b e l L_{CS3CCA} = L_{CCA} + \lambda_1 L_{cost-sensitive} + \lambda_2 L_{soft-label} LCS3CCA=LCCA+λ1Lcost−sensitive+λ2Lsoft−label

其中，

L C C A L_{CCA} LCCA 是CCA损失，用于最大化两个变换后数据集之间的相关性。
L c o s t − s e n s i t i v e L_{cost-sensitive} Lcost−sensitive 是成本敏感分类损失，用于处理数据集中的类不平衡问题。
L s o f t − l a b e l L_{soft-label} Lsoft−label 是软标签推断损失，用于利用未标注数据的潜在信息。
λ 1 \lambda_1 λ1 和 λ 2 \lambda_2 λ2 是超参数，用于平衡CCA损失、成本敏感损失和软标签损失的贡献。

训练过程

CS3CCA的训练过程涉及使用梯度下降或其他优化算法来最小化上述定义的损失函数。

这意味着要调整网络参数 θ 1 \theta_1 θ1 和 θ 2 \theta_2 θ2 ，使得变换后的数据在CCA空间中尽可能地相关，同时通过成本敏感学习和软标签推断策略来优化模型在不平衡数据和未标注数据上的性能。

结论

CS3CCA是一种创新的半监督多视图学习方法，特别适合于处理不平衡数据集和半监督学习场景。

通过结合CCA、成本敏感学习和软标签推断策略，CS3CCA能够在有限的标注信息下，从多源数据中学习高质量的共享表示，这对于提高模型在实际应用中的鲁棒性和泛化能力至关重要。

标签：基于,数据,标签,视图,学习,监督,推断,CS3CCA,CCA
From： https://blog.csdn.net/weixin_50569789/article/details/140249583

基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典
基于标签传播的半监督典型相关分析（Semi-supervisedCanonicalCorrelationanalysisbasedonLabelPropagation,LPbSCCA）是一种结合了典型相关分析（CCA）和标签传播技术的半监督学习方法，由Shen等人提出。该方法特别适用于处理只有部分样本带有标签的多视图数据集，旨在利用少......
人脸识别与美颜算法实战：基于Python、机器学习与深度学习
代码和pdf书等：GitHub-guozhe1992/read引言与基础知识：介绍人脸识别与美颜算法的基本概念、应用场景以及Python编程和机器学习的基础知识。视频图像处理技术：详细讲解基于Anaconda和PyCharm的环境搭建，以及视频图像处理的基础技术，如图像读取、显示、保存和格式转换等。抖音特效......
javab毕业设计-基于Java的校园二手交易商城系统设计与实现，基于springboot+vue二手跳蚤
文章目录背景介绍演示视频(进入B站观看画面更清晰)：项目架构和内容获取（文末获取）部分功能展示用户前端系统管理后台项目相关文件为什么我？本章节给大家带来的是一个基于java的大学生二手交易平台系统设计与实现，可适用于校园二手交易系统，基于Java的二手交易商城系统，大学......
FlexibleBI基于人工智能赋能的自主可控尺寸公差质量管理工具
在现代制造业中，车身零件的尺寸和公差管理至关重要。为了应对不断增加的质量要求和复杂的生产环境，我们推出了一款先进的尺寸公差质量管理软件。该软件结合了人工智能的强大功能，类似于市场上高端软件，却有着更高的性价比和本地化支持。FlexibleBI自主可控的国产化三坐标CMM尺寸......
基于STM32设计的智能台灯(HC05蓝牙控制)179
基于STM32设计的智能台灯(HC05蓝牙控制)(179)文章目录一、前言1.1项目介绍【1】开发背景【2】项目实现的功能【3】项目硬件模块组成1.2设计思路【1】整体设计思路【2】整体构架1.3项目开发背景【1】选题的意义【2】可行性分析【3】参考......
基于Java酒店管理系统
作者介绍：✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术：Html、Cs......
基于Java电子商城
作者介绍：✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术：Html、Cs......
基于Java酒店管理系统
作者介绍：✌全网粉丝10W+本平台特邀作者、博客专家、CSDN新星计划导师、软件领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于项目实战✌一、作品包含源码+数据库+设计文档万字+全套环境和工具资源+部署教程二、项目技术前端技术：Html、Cs......
基于Go 1.19的站点模板爬虫
创建一个基于Go1.19的站点模板爬虫涉及到几个关键步骤：初始化项目，安装必要的包，编写爬虫逻辑，以及处理和存储抓取的数据。下面是一个简单的示例，使用goquery库来解析HTML，并使用net/http来发起HTTP请求。请注意，实际部署爬虫时，需要遵守目标网站的robots.txt规则和版权政策。首先......
基于SSM的学校运动会信息管理系统（有报告）。Javaee项目。ssm项目。
演示视频：基于SSM的学校运动会信息管理系统（有报告）。Javaee项目。ssm项目。项目介绍：采用M（model）V（view）C（controller）三层体系结构，通过Spring+SpringMvc+Mybatis+Jsp+Maven来实现。MySQL数据库作为系统数据储存平台，实现了基于B/S结构的Web系统。报告截图：......