首页 > 其他分享 >“傻瓜”学计量——主成分分析法PCA(原理+实操)

“傻瓜”学计量——主成分分析法PCA(原理+实操)

时间:2024-03-16 22:01:35浏览次数:12  
标签:变量 特征 分析法 成分 实操 哔哩 PCA

提纲:

1.PCA原理

2.视频推荐:PCA原理     spass操作      stata操作+matlab实操

1.背景

在一些领域中,需要对大量数据进行观测。但是可能会带来变量之间具有相关性、分别对每个指标分析带来的偏误,等问题。因此,要寻找一个合理的方法,在减少需要分析的直白哦的同时,尽量减少原指标包含的信息缺失。通常做法是对有关联性的变量进行合并,这样就可以用较少的综合指标分别代表存在于各个变量中的各类信息。常用的方法有:主成分分析法、因子分析法。

2.PCA原理详解——数据降维

降维是对高纬度特征数据预处理,去除噪声和不重要的特征,保留下最重要的一些特征的方法。降维算法主要有:奇异值分解(SVD)奇异值分解(SVD)、主成分分析(PCA)、因子分析(FA)、独立成分分析(ICA)。

PCA(Principal Component Analysis),即主成分分析方法。主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。

3.推荐视频

3.1.PCA原理

 

用最直观的方式告诉你:什么是主成分分析PCA_哔哩哔哩_bilibili

3.2.PCA spass操作

30分钟掌握主成分分析--SPSS实战操作_哔哩哔哩_bilibili

 主成分操作步骤(实践版)

1、为消除量纲的影响,先对数据进行标准化处理;
2、计算相关系数:一般认为各变量之间的相关系数大于0.3较好;
3、KMO检验和Barlett(巴特利)检验:
(1)KMO取样适切性量数≥0.6较为适宜
(2)sig也即显著性一般小于0.05较为适宜;
4、计算特征值和特征向量:提取特征值大于1且方差贡献率累计达到85%左右

的主成分;

5、识别主成分的贡献率和累计贡献率;

6、计算各个主成分的得分:F1=wnX1+wi2X2+ ... +wmXm

6、计算各个主成分的得分:F1=wnX1+wi2X2+ ... +wimXn

,表示主成分中各个变量的权重,\thetaj为成分矩阵中每个变量对应的

系数,而√\lambdai第i个主成分对应的特征值的开根值;

7、计算综合得分:F=α1F1+α2F2+ ... +αnFn

α,表示第i个主成分的方差百分比

3.3.PCA stata操作+matlab实操

【最全】主成分分析法stata操作讲解+主成分分析法matlab操作讲解+主成分分析法(PCA)理论部分讲解_哔哩哔哩_bilibili

标签:变量,特征,分析法,成分,实操,哔哩,PCA
From: https://blog.csdn.net/nnpersistent/article/details/136768346

相关文章

  • 谷粒学院-尚硅谷项目,实操错误一览
    2023.12.1900:09node/npm版本,nvm解决vue版本,改version跨域问题,@CrossOrigin/gateway代码规范,强推ESLint海外镜像,阿里taobao镜像json体缺实体value/configurationPropertiesrundev报错,非对应运行路径项目全局报错,数据库未启动,自启动403,跨域/路径错误TypeError,undefined,后端未传值......
  • 一个简单的实操案例
    需求统计今日总消息量统计今日每小时消息量、发送和接收用户数统计今日各地区发送消息数据量统计今日发送消息和接收消息的用户数统计今日发送消息最多的Top10用户统计今日接收消息最多的Top10用户统计发送人的手机型号分布情况统计发送人的设备操作系统分布情况约3......
  • R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化
    全文链接:https://tecdat.cn/?p=35360原文出处:拓端数据部落公众号随着农业和农村经济的快速发展,各地区之间的经济差异日益显著。为了更好地理解这种差异,并为政策制定提供科学依据,本研究帮助客户采用了聚类分析和因子分析、主成分分析3种无监督学习方法,对多个省份的农业、林业、牧......
  • 第六十九天 BBS项目之五 js与模板语法 inclusion_tag实操,文章详情,点赞点踩
    一、昨日内容回顾#1首页文章的渲染 -模板语法的for循环-bootstrap的媒体组-显示头像:articel.blog.userinfo有可能没有:在admin中建立关系 -注册---》申请开启博客功能-图标库 -font-awesome-4.7.0#2个人站点样式 -头部导航栏-......
  • MySQL字段长度详解 附实操分析
    一、前言搜了下有关方面的内容发现良莠不齐。大部分人对这方面的内容也比较模糊,先附上MYSQL常用类型图。二、字节首先需要达成共识的是:1个Byte字节等于8个bit位。bit是最小一级的信息单位,可以表示一个0或1(即二进制);那么由此我们可以计算,一个字节其实可以表示256种取值。计算方......
  • 实操手册
    善工平台实操手册 目录目录一、学员PC设备网络(服务器带外)1.连接远程桌面2.ABCD平台服务器BMC使用3.善工中台访问方式二、学员登录信息表1.平台A学员远程桌面2.平台B学员远程桌面3.平台C学员远程桌面4.平台D学员远程桌面三、学员地址使用范围  注意:所有学员不允......
  • R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
    全文链接:https://tecdat.cn/?p=35263原文出处:拓端数据部落公众号本研究旨在帮助客户利用房价数据集进行数据分析,该数据集包含82个变量和2930个数据点。研究目标是通过分类算法将房价分为两个类别。在数据预处理阶段,排除了Order、PID和SalesPrice等变量,对数据进行整合和转换以适......
  • 安卓使用HttpCanary进行抓包
    IOS抓包软件Stream的安装与使用使用「Stream」进行IOS抓包同样的代码,有时候在安卓端会出现不同的问题,所以还需要进行安卓的抓包另外安卓非Root用户的抓包比较麻烦,需要安装指定版本的HttpCannary(小黄鸟)HttpCanary介绍1、观看抓包软件的結果还能抓取音频以及视频。2、可以自动式......
  • Airtest-Selenium实操小课:刷B站视频
    1.前言上一课我们讲到用Airtest-Selenium爬取网站上我们需要的信息数据,还没看的同学可以戳这里看看~那么今天的推文,我们就来说说看,怎么实现看b站、刷b站的日常操作,包括点击暂停,发弹幕,点赞,收藏等操作,仅供大家参考学习~2.需求分析和准备整体的需求大致可以分为以下步骤:打开chr......
  • pca降维
    实际使用数据集的时候由于特征很多,会很耗时,因此需要减少特征,但是不知道特征多少合适,这个时候就要使用特征降维降维作用(1)使得数据集更容易使用(2)降低很多算法的计算开销(3)去除噪声(4)多维数据不容易画图,降低维度容易画图,使结果容易理解。优点:降低数据的复杂性,识别出最重要的多个特征......