首页 > 其他分享 >9月25日总结

9月25日总结

时间:2023-10-03 14:33:30浏览次数:40  
标签:总结 25 方差 特征 矩阵 协方差 成分 数据

概述

主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维和特征提取技术,用于将高维数据转换为低维的特征空间。其目标是通过线性变换将原始特征转化为一组新的互相无关的变量,这些新变量称为主成分,它们按照方差递减的顺序排列,以保留尽可能多的原始数据信息。
主成分分析的基本思想可以总结如下:

寻找新的特征空间:PCA通过线性变换,寻找一组新的特征空间,使得新的特征具有以下性质:
    主成分具有最大的方差,尽可能保留原始数据的信息。
    不同主成分之间彼此无关,即它们是正交的(互相垂直)。
降低数据维度:保留方差较大的主成分,舍弃方差较小的主成分,从而实现数据降维。

主成分分析的步骤如下:

中心化数据:将原始数据进行中心化,使得数据的均值为零。
计算协方差矩阵:计算特征之间的协方差矩阵,描述了特征之间的线性关系。
计算特征值和特征向量:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
选择主成分:按照特征值的大小选择保留的主成分数量,通常选择方差较大的前几个主成分。
得到新的特征空间:将原始特征投影到选定的主成分上,得到新的特征空间。

主成分分析的应用包括降维、去除数据噪声、数据可视化、特征选择等。通过保留最重要的特征,可以在减少数据维度的同时保持对数据的关键信息进行捕获。
在实际使用中,有时会将各个变量进行标准化,此时的协方差矩阵就相当于原始数据的相关系数矩阵。所以Alink的主成分分析组件提供了两种计算选择,参数CalculationType可以设置为相关系数矩阵(CORR)或者协方差矩阵(COV),默认为相关系数矩阵,即对标准化后的数据计算其主成分。
Alink库中的实现与应用
示例

以美国50个州的7种犯罪率为例,做主成分分析。这7种犯罪分别是:"murder", "rape", "robbery", "assault", "burglary", "larceny", "auto"。从这7个变量出发来评价各州的治安和犯罪情况是很难的,而使用主成分分析可以把这些变量概括为2-3个综合变量(即主成分),便于更简便的分析这些数据。

/**

  • 主成分分析
  • 1.基于默认的计算方式(CORR),计算主成分

标签:总结,25,方差,特征,矩阵,协方差,成分,数据
From: https://www.cnblogs.com/lmyy/p/17741116.html

相关文章

  • 9月29日总结
    以OpenAI的ChatGPT所掀起的GenAI快速创新浪潮,其中连接LLM和应用之间的桥梁的两大开源项目:LangChain[1]和SemanticKernel[2],在半年前写过一篇文章LangChainvsSemanticKernel[3],这半年以来Semantickernel有了显着改进,这篇文章反应了最新的更新。SemanticKernel(SK)是......
  • 9月28日总结
    能够对于文字、段落乃至任何元素的精准定位并做出增删改查,都是在开发一款富文本编辑器时一项最基本也是最重要的功能之一。让我们先来看看Slate中对于如何在文档树中定位元素是怎么定义的[源码]:/**TheLocationinterfaceisaunionofthewaystorefertoaspecificloca......
  • 9.30每日总结
    今天是到家的第二天,首先我是不负众望地昏迷不醒,然后十二点出门觅食,下午去配了一副我日思夜想的黑框眼镜,顺便去磨了一个刀,晚上在电视中学习重要的人生经验,体味丰富的人生状态今天我学到了:如果人十二点之后起床,那么假期会变少~(>_<)~......
  • 9.28每日总结
    今天是回家的前一天晚上上午我学到了统一建模语言中关于图的定制,学习了乒乓球的姿势下午学习了数据结构中的队列,复习了栈,学习了离散数学中的闭包运算与集合运算晚上学习了营养与健康,收拾东西逃离河北(doge今天我学到了:东西要提前收拾,否则会使人手忙脚乱 ......
  • 洛谷5343总结
    这题我们很容易想出一个状态,设f[i][j]表示前i个长度划分长度为j的块的总方案然后我们自信的写出\(f[i][j]=f[i-1][j]+f[i][j-a[i]]\)但这其实是错的!这跟背包很想,+f[i][j-a[i]]这一项的本质是说这个长度为j的块的最后一段的长度是a[i],但其实最后一段的长度是不定的,所以我们可以写......
  • 2023信友队提高组复赛冲刺班 10.2赛后总结
    T1:区块链赛场上还以为很难,直接打表,80pts。本来以为还不错,结果一堆人AC,吐血!算了,还是来说说正解吧,说多了都是血和泪啊啊啊!先对开头的公式进行变形,得到:nb/(b-n)xorb=a通过大量的样例我们可以发现,当b=n+1时,nb/(b-n)取到最大值这是为什么呢?我们可以来证明一下:∵ nb/(b-n)是......
  • C++ STL 一般总结
    以下内容来源网上经过整合而成一、一般介绍     STL(StandardTemplateLibrary),即标准模板库,是一个具有工业强度的,高效的C++程序库。它被容纳于C++标准程序库(C++StandardLibrary)中,是ANSI/ISOC++标准中最新的也是极具革命性的一部分。该库包含了诸多在计算机科学领域里......
  • 每日总结
    今天又画了一点的网页。学习了python的爬虫代码,主要是读别人的代码。importurllib.requestimporturllib.parseurl='https://www.baidu.com/s?wd='#请求对象的定制为了解决反爬的第一种手段headers={'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x6......
  • 每日总结
    今日收获今天背了单词!将国庆的作业写完啦!!(当然,后续有了更好的灵感会继续改正和完善);还找了找关于C#的模板;明天预计学习大数据喽!!!背单词!!!备考软考!!再弄一弄C#的那个作业去;......
  • Adobe_Photoshop_2024_25.0.0.37图文安装教程及下载
    Adobe_Photoshop_2024正式版,拥有之前beta版本的全部功能,包括但不限于内置AI绘图,一键抠图、移除工具、悬浮工具栏、图像扩展、填充式生成、调整预设等等。尤其是“生成式填充”和“生成式扩展”。除此之外,PS2024正式版还内置了NeuralFilters神经AI滤镜,这款插件用于图片的处理,它......