首页 > 其他分享 >线性判别分析 (LDA)中目标函数的每个部分的具体说明

线性判别分析 (LDA)中目标函数的每个部分的具体说明

时间:2024-09-25 12:53:36浏览次数:14  
标签:LDA 类间 投影 判别分析 mu wT 线性 Sigma 向量

公式:

F = ∥ w T μ 0 − w T μ 1 ∥ 2 2 w T Σ 0 w + w T Σ 1 w = w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w T ( Σ 0 + Σ 1 ) w F = \frac{\left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2}{w^T \Sigma_0 w + w^T \Sigma_1 w} = \frac{w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w}{w^T (\Sigma_0 + \Sigma_1) w} F=wTΣ0​w+wTΣ1​w ​wTμ0​−wTμ1​ ​22​​=wT(Σ0​+Σ1​)wwT(μ0​−μ1​)(μ0​−μ1​)Tw​

符号说明:

  1. F F F
    这是目标函数,代表我们要最大化的值。LDA 的核心目标是找到一个投影向量 w w w,使得类间距离最大化、类内散度最小化。这个函数的最大化表示最佳投影方向。

  2. w w w
    投影向量(或称权重向量),它是我们要优化的对象。这个向量定义了将高维数据投影到低维(通常是一维)时的方向。通过选择合适的 w w w,我们能够更好地区分不同的类。

  3. μ 0 \mu_0 μ0​ μ 1 \mu_1 μ1​
    分别是类 0 和类 1 的均值向量。这些向量表示每个类样本的中心点或平均位置。

    • μ 0 \mu_0 μ0​:类 0 的样本均值(一个列向量)。
    • μ 1 \mu_1 μ1​:类 1 的样本均值(一个列向量)。
  4. Σ 0 \Sigma_0 Σ0​ Σ 1 \Sigma_1 Σ1​
    分别是类 0 和类 1 的协方差矩阵,它们表示类内散布的情况。协方差矩阵描述了类内样本的分散性和相关性。

    • Σ 0 \Sigma_0 Σ0​:类 0 的协方差矩阵。
    • Σ 1 \Sigma_1 Σ1​:类 1 的协方差矩阵。
  5. w T w^T wT
    w T w^T wT 是 w w w 的转置,它是一个行向量(1×n),与列向量相乘时可以计算出标量。转置表示将列向量 w w w 转化为行向量。

  6. w T μ 0 − w T μ 1 w^T \mu_0 - w^T \mu_1 wTμ0​−wTμ1​
    这是类 0 和类 1 的均值向量在方向 w w w 上的投影差,表示两类中心在投影方向上的距离。通过找到最合适的 w w w,我们希望这个投影差(类间差异)尽可能大。

  7. ∥ w T μ 0 − w T μ 1 ∥ 2 2 \left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2 ​wTμ0​−wTμ1​ ​22​
    这是类 0 和类 1 均值投影差的欧氏距离的平方。它表示两个类中心在投影方向上的差异,用于度量类间散度。 ∥ ⋅ ∥ 2 \left\| \cdot \right\|_2 ∥⋅∥2​ 是 L2 范数(欧氏距离)。

  8. ( μ 0 − μ 1 ) (\mu_0 - \mu_1) (μ0​−μ1​) ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0​−μ1​)T

    • μ 0 − μ 1 \mu_0 - \mu_1 μ0​−μ1​ 是类 0 和类 1 的均值向量差,它表示两个类的中心点之间的差异。
    • ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0​−μ1​)T 是该差向量的转置,它与 w w w 的乘积用于表示类间差异的矩阵形式。
  9. w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0​−μ1​)(μ0​−μ1​)Tw
    这表示的是类间散度的矩阵形式。通过这个表达式,我们能够将类间的中心差异转化为矩阵运算,以方便后续的优化计算。

  10. w T Σ 0 w w^T \Sigma_0 w wTΣ0​w w T Σ 1 w w^T \Sigma_1 w wTΣ1​w
    这是类 0 和类 1 的协方差矩阵在方向 w w w 上的投影,表示类内散度。通过找到合适的 w w w,我们希望类内散度尽可能小。

  11. w T ( Σ 0 + Σ 1 ) w w^T (\Sigma_0 + \Sigma_1) w wT(Σ0​+Σ1​)w
    这是类内散度的总和(类 0 和类 1 的协方差矩阵之和),它表示了数据在方向 w w w 上的总散度。我们希望这个值最小,以确保同类数据尽可能聚集在一起。

总结:

  • 分子部分:表示类间差异,目的是最大化两类中心在投影方向上的距离。
  • 分母部分:表示类内散布,目的是最小化每类数据在投影方向上的分散性。

这个公式是线性判别分析(LDA)的优化目标函数。通过最大化该函数,我们能够找到一个最佳的投影方向 w w w,使得不同类之间的区分度最大,而类内的样本尽可能聚集。

标签:LDA,类间,投影,判别分析,mu,wT,线性,Sigma,向量
From: https://blog.csdn.net/u013172930/article/details/142520392

相关文章

  • OPENLDAP部署完整版(Linux)附一键式脚本
    (一)环境信息1,系统环境2,域信息(本章节使用)(二)应用部署1,ladp部署1、yum方式安装OpenLDAP服务2、拷贝数据库配置配置文件,并启动服务3、slappasswd生成OpenLDAP管理员密码4、导入基本的模式5、在OpenLDAPDB上配置域信息2,安装phpLDAPadmin实现通过Web管理LDAP服务1,部署httpd2,部署php应......
  • OpenCV_自定义线性滤波(filter2D)应用详解
    OpenCVfilter2D将图像与内核进行卷积,将任意线性滤波器应用于图像。支持就地操作。当孔径部分位于图像之外时,该函数根据指定的边界模式插值异常像素值。卷积核本质上是一个固定大小的系数数组,数组中的某个元素被作为锚点(一般是数组的中心)。上面讲了线性滤波的实质就是计算相......
  • 【数一线性代数】014入门
    Index本文稍后补全,推荐阅读:https://blog.csdn.net/weixin_60702024/article/details/141883851分析实现总结本文稍后补全,推荐阅读:https://blog.csdn.net/weixin_60702024/article/details/141883851请设计一个算法,将给定的表达式树(二叉树)转换为等价的中缀表达式(通过......
  • 线性表应用
    一、线性表的定义和特点定义:线性表是具有相同特性的数据元素的一个有限序列,由n(n>=0)个数据元素(结点)a1,a2,a3...an组成的有限序列。    其中数据元素的个数n定义为表的长度。    当n=0时称为空表。    将非空的线性表(n>0)记作:(a1,a2,...an)  ......
  • 抛开线性回归模型,基于树模型来尝试构建回归模型,可视化绘制树状层级结构
    一提到回归,可能很多人第一时间脑海里想到的就是线性回归模型,的确,线性回归器可以说是非常常用的模型了。线性回归模型广泛应用于各种领域,如经济学、金融学、社会科学、工程学等。它可以用于预测、因果分析、趋势分析等。线性回归模型是一种广泛应用于统计学和机器学习中的预测模......