首页 > 其他分享 >线性判别分析 (LDA)中目标函数的每个部分的具体说明

线性判别分析 (LDA)中目标函数的每个部分的具体说明

时间:2024-09-25 12:53:36浏览次数:10  
标签:LDA 类间 投影 判别分析 mu wT 线性 Sigma 向量

公式:

F = ∥ w T μ 0 − w T μ 1 ∥ 2 2 w T Σ 0 w + w T Σ 1 w = w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w T ( Σ 0 + Σ 1 ) w F = \frac{\left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2}{w^T \Sigma_0 w + w^T \Sigma_1 w} = \frac{w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w}{w^T (\Sigma_0 + \Sigma_1) w} F=wTΣ0​w+wTΣ1​w ​wTμ0​−wTμ1​ ​22​​=wT(Σ0​+Σ1​)wwT(μ0​−μ1​)(μ0​−μ1​)Tw​

符号说明:

  1. F F F
    这是目标函数,代表我们要最大化的值。LDA 的核心目标是找到一个投影向量 w w w,使得类间距离最大化、类内散度最小化。这个函数的最大化表示最佳投影方向。

  2. w w w
    投影向量(或称权重向量),它是我们要优化的对象。这个向量定义了将高维数据投影到低维(通常是一维)时的方向。通过选择合适的 w w w,我们能够更好地区分不同的类。

  3. μ 0 \mu_0 μ0​ μ 1 \mu_1 μ1​
    分别是类 0 和类 1 的均值向量。这些向量表示每个类样本的中心点或平均位置。

    • μ 0 \mu_0 μ0​:类 0 的样本均值(一个列向量)。
    • μ 1 \mu_1 μ1​:类 1 的样本均值(一个列向量)。
  4. Σ 0 \Sigma_0 Σ0​ Σ 1 \Sigma_1 Σ1​
    分别是类 0 和类 1 的协方差矩阵,它们表示类内散布的情况。协方差矩阵描述了类内样本的分散性和相关性。

    • Σ 0 \Sigma_0 Σ0​:类 0 的协方差矩阵。
    • Σ 1 \Sigma_1 Σ1​:类 1 的协方差矩阵。
  5. w T w^T wT
    w T w^T wT 是 w w w 的转置,它是一个行向量(1×n),与列向量相乘时可以计算出标量。转置表示将列向量 w w w 转化为行向量。

  6. w T μ 0 − w T μ 1 w^T \mu_0 - w^T \mu_1 wTμ0​−wTμ1​
    这是类 0 和类 1 的均值向量在方向 w w w 上的投影差,表示两类中心在投影方向上的距离。通过找到最合适的 w w w,我们希望这个投影差(类间差异)尽可能大。

  7. ∥ w T μ 0 − w T μ 1 ∥ 2 2 \left\| w^T \mu_0 - w^T \mu_1 \right\|_2^2 ​wTμ0​−wTμ1​ ​22​
    这是类 0 和类 1 均值投影差的欧氏距离的平方。它表示两个类中心在投影方向上的差异,用于度量类间散度。 ∥ ⋅ ∥ 2 \left\| \cdot \right\|_2 ∥⋅∥2​ 是 L2 范数(欧氏距离)。

  8. ( μ 0 − μ 1 ) (\mu_0 - \mu_1) (μ0​−μ1​) ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0​−μ1​)T

    • μ 0 − μ 1 \mu_0 - \mu_1 μ0​−μ1​ 是类 0 和类 1 的均值向量差,它表示两个类的中心点之间的差异。
    • ( μ 0 − μ 1 ) T (\mu_0 - \mu_1)^T (μ0​−μ1​)T 是该差向量的转置,它与 w w w 的乘积用于表示类间差异的矩阵形式。
  9. w T ( μ 0 − μ 1 ) ( μ 0 − μ 1 ) T w w^T (\mu_0 - \mu_1)(\mu_0 - \mu_1)^T w wT(μ0​−μ1​)(μ0​−μ1​)Tw
    这表示的是类间散度的矩阵形式。通过这个表达式,我们能够将类间的中心差异转化为矩阵运算,以方便后续的优化计算。

  10. w T Σ 0 w w^T \Sigma_0 w wTΣ0​w w T Σ 1 w w^T \Sigma_1 w wTΣ1​w
    这是类 0 和类 1 的协方差矩阵在方向 w w w 上的投影,表示类内散度。通过找到合适的 w w w,我们希望类内散度尽可能小。

  11. w T ( Σ 0 + Σ 1 ) w w^T (\Sigma_0 + \Sigma_1) w wT(Σ0​+Σ1​)w
    这是类内散度的总和(类 0 和类 1 的协方差矩阵之和),它表示了数据在方向 w w w 上的总散度。我们希望这个值最小,以确保同类数据尽可能聚集在一起。

总结:

  • 分子部分:表示类间差异,目的是最大化两类中心在投影方向上的距离。
  • 分母部分:表示类内散布,目的是最小化每类数据在投影方向上的分散性。

这个公式是线性判别分析(LDA)的优化目标函数。通过最大化该函数,我们能够找到一个最佳的投影方向 w w w,使得不同类之间的区分度最大,而类内的样本尽可能聚集。

标签:LDA,类间,投影,判别分析,mu,wT,线性,Sigma,向量
From: https://blog.csdn.net/u013172930/article/details/142520392

相关文章

  • OPENLDAP部署完整版(Linux)附一键式脚本
    (一)环境信息1,系统环境2,域信息(本章节使用)(二)应用部署1,ladp部署1、yum方式安装OpenLDAP服务2、拷贝数据库配置配置文件,并启动服务3、slappasswd生成OpenLDAP管理员密码4、导入基本的模式5、在OpenLDAPDB上配置域信息2,安装phpLDAPadmin实现通过Web管理LDAP服务1,部署httpd2,部署php应......
  • OpenCV_自定义线性滤波(filter2D)应用详解
    OpenCVfilter2D将图像与内核进行卷积,将任意线性滤波器应用于图像。支持就地操作。当孔径部分位于图像之外时,该函数根据指定的边界模式插值异常像素值。卷积核本质上是一个固定大小的系数数组,数组中的某个元素被作为锚点(一般是数组的中心)。上面讲了线性滤波的实质就是计算相......
  • 【数一线性代数】014入门
    Index本文稍后补全,推荐阅读:https://blog.csdn.net/weixin_60702024/article/details/141883851分析实现总结本文稍后补全,推荐阅读:https://blog.csdn.net/weixin_60702024/article/details/141883851请设计一个算法,将给定的表达式树(二叉树)转换为等价的中缀表达式(通过......
  • 线性表应用
    一、线性表的定义和特点定义:线性表是具有相同特性的数据元素的一个有限序列,由n(n>=0)个数据元素(结点)a1,a2,a3...an组成的有限序列。    其中数据元素的个数n定义为表的长度。    当n=0时称为空表。    将非空的线性表(n>0)记作:(a1,a2,...an)  ......
  • 抛开线性回归模型,基于树模型来尝试构建回归模型,可视化绘制树状层级结构
    一提到回归,可能很多人第一时间脑海里想到的就是线性回归模型,的确,线性回归器可以说是非常常用的模型了。线性回归模型广泛应用于各种领域,如经济学、金融学、社会科学、工程学等。它可以用于预测、因果分析、趋势分析等。线性回归模型是一种广泛应用于统计学和机器学习中的预测模......
  • XT4057 具有热调节功能单片双灯显示的微型线性电池管理芯片
    1产品概述●XT4057是一个完善的单片锂离子电池恒流/恒压线形电源管理芯片。它薄的尺寸和小的外包装使它便于便携应用。更值得一提的是,XT4057专门设计适用于USB的供电规格。得益于内部的MOSFET结构,在应用上不需要外部电阻和阻塞二极管。在高能量运行和高外围温度时,热反......
  • 非线性规划——无约束最优化问题精讲
    最优化问题的研究历史可以追溯到17世纪的变分法,随着数学、物理学、经济学和计算科学的不断发展,最优化问题逐渐成为一个独立的学科。对于无约束最优化问题的求解,从最早的最速下降法,到后来的牛顿法和共轭梯度法,再到现代的变尺度法和智能算法,发展历程反映了科学技术进步的轨迹。无约......
  • 数据结构-线性表的单链式存储结构图解及C语言实现
    概念链式存储:结点在存储器中的位置是任意的,即逻辑相邻的数据元素在物理上不一定相邻链式存储结构也称非顺序映像或链式映像图解链式存储结构中结点一般有两个部分组成,即数据域(data)和指针域,数据域是用于存放数据的,指针域是用来指向下一结点的地址的,其中头节点指向该链表......
  • 数据结构线性表两种方式分享
    第一种方式为老师说的数组+结构体(课本上),我用的是c++,其实与c没什么不同(区别:cin是scanf,cout是print,new是malloc()函数),我用的全局变量,所以不用传参。代码1:点击查看代码#include<iostream>#include<cstring>usingnamespacestd;constintN=1e4+5;structss{ charname[......
  • 筛质数(线性筛法--进阶版)(面对大部分都直接ac)
    给定一个正整数 n,请你求出 1∼n中质数的个数。输入格式共一行,包含整数 n。输出格式共一行,包含一个整数,表示 1∼n中质数的个数。数据范围1≤n≤10^6输入样例:8输出样例:4思路:给一个数:将质数筛到的同时,筛去它的倍数,并且该倍数一定是在给定的数内的这样在下次......