首页 > 其他分享 >主成分分析

主成分分析

时间:2024-10-11 19:44:55浏览次数:3  
标签:分析 特征值 变量 cov 矩阵 降维 成分 data

主成分分析 (PCA) - MATLAB & Simulink - MathWorks 中国

  1. 构建相关系数矩阵或协方差矩阵

    两个变量的协方差\(cov(x,y)=\frac{\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})}{n-1}\)

    协方差矩阵\(C= \begin{bmatrix} cov(x,x) & cov(x,y) \\ cov(x,y) & cov(y,y) \end{bmatrix}\)

  2. 再求协方差矩阵的特征向量、特征值。

  3. 每一个新变量就是用对应的特征向量乘旧变量构成的向量。

    例如对矩阵C,\(Z_1=\vec{v}\cdot \vec x\) .

  4. 得到了新变量后,可以按特征值占比大小给变量排序,让后累加取到>85%时的新变量,其它变量剔除,从而实现降维。

    每个特征向量特征值占比:\(\frac{\lambda_i}{\sum\lambda}\)

    如果,前三个新变量的占比总和>85%则就取前三个变量分析。

Matlab求特征值占比比例

data =  %数据读入
data = zscore(data);%数据标准化很重要
CorrCoefMatrix = corrcoef(data);%matlab自带函数计算相关系数矩阵,列表示随机变量,行表示观测值
[coeff latent explained] = pcacov(CorrCoefMatrix)
%coeff: 特征向量(注意与pca函数的变量score进行区分).
%latent: 特征值.
%explained:每个特征值占比,字面上即每个特征值对系统有多少解释,用百分比表示。explained=100*latent/sum(latent);

主成分分析降维

如果数据的维数过高可以用主成分分析降维。

原始数据的主成分分析 - MATLAB pca - MathWorks 中国

data_1 = pca(data);

TSNE降维

data_1 = tsne(data,'NumDimensions','2');%TSNE降维

标签:分析,特征值,变量,cov,矩阵,降维,成分,data
From: https://www.cnblogs.com/cxy1114blog/p/18459139

相关文章

  • 典型相关分析
    典型相关分析( Canonical Correlation analysis ) 研究两组变量(每个变量中都可能有多个指标,即每个变量都是向量)之间相关关系的一种多元统计方法,它能够揭示出两组变量之间的内在联系。步骤标准化数据计算原始变量X、Y增广阵的相关系数矩阵R。求典型相关系数以及典型变量。......
  • 对应分析
    为什么用对应分析对数据降维是经常使用因子分析和主成分分析。但因子分析对变量和对样本分别是R型和Q型,这两种分析方法往往是相互对立的,必须分别对样本和变量进行处理。如果关系样本和变量之间的关系,就不好用。这时,可用对应分析......
  • JVM系列1:深入分析Java虚拟机堆和栈及OutOfMemory异常产生原因
    JVM系列1:深入分析Java虚拟机堆和栈及OutOfMemory异常产生原因前言JVM系列文章如无特殊说明,一些特性均是基于HotSpot虚拟机和JDK1.8版本讲述。下面这张图我想对于每个学习Java的人来说再熟悉不过了,这就是整个JDK的关系图: 从上图我们可以看到,JavaVirtualMachine位于最底......
  • 自动化分析背后,一站式数据分析平台!
    自动化分析背后,一站式数据分析平台!前言一站式数据分析平台前言在如今的企业管理中,数据已经不再是简单的存储和备份,而是成为了决策的核心驱动力。尤其是在面对海量数据的情况下,企业急需一个能够高效处理、分析、整合和呈现数据的工具。而这正是一站式数据分析平台应......
  • 什么是iPaaS?iPaaS选型、落地及案例分析
    在iPaaS行业摸爬滚打已经8个年头了。从最初的技术支持做起,到现在负责整个集成项目的规划和实施,我见证了iPaaS技术在国内的快速发展。今天,我想和大家深入聊聊iPaaS这个话题,希望能给正在考虑数字化转型的企业一些参考。什么是iPaaS?iPaaS全称是"IntegrationPlatformasaService"......
  • java+vue计算机毕设工作计划统计分析系统【源码+程序+论文+开题】
    本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景在当今快节奏的商业环境中,企业的高效运作离不开精细化的管理与规划。随着企业规模的扩大,部门间协作的复杂性、员工工作计划的多样性以及项目进度的动......
  • 【机器学习(十三)】机器学习回归案例之股票价格预测分析—Sentosa_DSML社区版
    文章目录一、背景描述二、Python代码和Sentosa_DSML社区版算法实现对比(一)数据读入(二)特征工程(三)样本分区(四)模型训练和评估(五)模型可视化三、总结一、背景描述  股票价格是一种不稳定的时间序列,受多种因素的影响。影响股市的外部因素很多,主要有经济......
  • SWAP农业模型数据制备、敏感性分析及气候变化影响
    SWAP模型的各个组成部分,包括气象、土壤、作物和管理措施等数据的准备和输入。通过模型的实践操作和结果分析,让参与者能够不仅理解模型背后的科学原理,同时掌握如何在实际工作中应用模型来解决问题。此外,还将深入探讨如何通过修改模型代码来定制和优化模型,以适应特定的研究需求或......
  • Freertos应用与源码分析:临界区
    目录一、概述二、应用三、源码分析1、进入临界区2、退出临界区3、中断临界区(1)应用(2)进入中断临界区(3)退出中断临界区四、注意事项一、概述        当一个任务在使用某个资源的过程中,即还没有完全结束对资源的访问时,便被切出运行态,使得资源处于非一致,不完整......
  • 流域生态系统服务评价、水文水生态分析、碳收支、气候变化影响、制图等领域中的应用
    流域生态系统服务评价、水文水生态分析、碳收支、气候变化影响、制图等领域中的应用专题一、生态系统服务评价技术框架1.1生态系统服务概述1.2流域生态系统服务的分类与作用1.3生态系统服务评估方法专题二、AI大模型与生态系统服务评价2.1目前常用大模型介绍2.2......