代价敏感的半监督典型相关分析(Cost Sensitive Semi-Supervised Canonical Correlation Analysis, CS3CCA)是一种专门设计用于处理不平衡数据和半监督学习
场景下的多视图数据分析方法。
这种方法由Wan等人提出,其核心是通过引入代价敏感学习和软标签推断策略
,以优化在不平衡数据集上的表现
,并充分利用有限的标注信息
来增强学习模型。
CS3CCA的目标
CS3CCA的目标是在两个或多个视图(数据集)之间学习一组共享的潜在表示
,即使得每个数据集的潜在表示在CCA的意义上具有最大的相关性
。
同时,它通过代价敏感学习来应对数据集中的类不平衡问题,并利用软标签推断策略来利用未标注数据的潜在信息
,以提升模型的整体性能。
成本敏感学习
在成本敏感学习中,不同的错误类型(如假阳性与假阴性)可能会有不同的惩罚成本。
在不平衡数据集中,少数类别的误分类往往比多数类别的误分类更加严重。
因此,CS3CCA通过调整不同类别的误分类成本,来优化模型在不平衡数据集上的性能。
软标签推断
软标签推断策略
是指在半监督学习场景下,通过模型预测或某种概率推断方法为未标注数据生成“软”标签(即概率分布)
,并将其作为额外的信息来指导模型训练。在CS3CCA中,软标签推断有助于充分利用未标注数据的潜在结构信息
,从而提升模型的泛化能力。
CS3CCA的数学框架
假设我们有两个数据集
X
1
\mathbf{X}_1
X1 和
X
2
\mathbf{X}_2
X2 ,每个数据集包含
N
N
N 个样本,可能有不同的特征维度
。
其中,一部分样本带有类别标签,而大部分样本是未标记的。
CS3CCA的目标是找到两个非线性变换
f
1
(
X
1
;
θ
1
)
f_1(\mathbf{X}_1; \theta_1)
f1(X1;θ1) 和
f
2
(
X
2
;
θ
2
)
f_2(\mathbf{X}_2; \theta_2)
f2(X2;θ2) ,使得变换后的数据在CCA的意义上具有最大的相关性
,同时利用成本敏感学习和软标签推断策略
来优化模型在不平衡数据和未标注数据上的性能。
CS3CCA的损失函数
CS3CCA的损失函数通常包含三个部分:
- CCA损失:用于最大化变换后数据集之间的
相关性,类似于DCCA中的CCA损失。
- 成本敏感分类损失:用于处理数据集中的
类不平衡问题
,通过调整不同类别的误分类成本
来优化模型性能。 - 软标签推断损失:用于
利用未标注数据的潜在信息,通过生成软标签来指导模型训练。
具体的损失函数可以表示为:
L C S 3 C C A = L C C A + λ 1 L c o s t − s e n s i t i v e + λ 2 L s o f t − l a b e l L_{CS3CCA} = L_{CCA} + \lambda_1 L_{cost-sensitive} + \lambda_2 L_{soft-label} LCS3CCA=LCCA+λ1Lcost−sensitive+λ2Lsoft−label
其中,
-
L
C
C
A
L_{CCA}
LCCA 是CCA损失,用于最大化两个变换后数据集之间的
相关性。
-
L
c
o
s
t
−
s
e
n
s
i
t
i
v
e
L_{cost-sensitive}
Lcost−sensitive 是
成本敏感分类损失
,用于处理数据集中的类不平衡问题。
-
L
s
o
f
t
−
l
a
b
e
l
L_{soft-label}
Lsoft−label 是
软标签推断损失
,用于利用未标注数据的潜在信息。
-
λ
1
\lambda_1
λ1 和
λ
2
\lambda_2
λ2 是超参数,用于平衡CCA损失、成本敏感损失和软标签损失的
贡献。
训练过程
CS3CCA的训练过程涉及使用梯度下降或其他优化算法
来最小化上述定义的损失函数。
这意味着要调整网络参数
θ
1
\theta_1
θ1 和
θ
2
\theta_2
θ2 ,使得变换后的数据在CCA空间中尽可能地相关,同时通过成本敏感学习和软标签推断策略来优化模型在不平衡数据和未标注数据上的性能。
结论
CS3CCA是一种创新的半监督多视图学习方法,特别适合于处理不平衡数据集和半监督学习场景。
通过结合CCA、成本敏感学习和软标签推断策略,CS3CCA能够在有限的标注信息下,从多源数据中学习高质量的共享表示,这对于提高模型在实际应用中的鲁棒性和泛化能力至关重要。
标签:基于,数据,标签,视图,学习,监督,推断,CS3CCA,CCA From: https://blog.csdn.net/weixin_50569789/article/details/140249583