• 2024-10-01【机器学习-无监督学习】降维与主成分分析
    【作者主页】FrancekChen【专栏介绍】⌈⌈⌈Python机器学习⌋
  • 2024-09-21[神经网络与深度学习笔记]PCA降维
    PCA降维PCA是一种无监督降维算法,它是最常用的降维算法之一,可以很好的解决因变量太多而复杂性,计算量增大的弊端。本质上讲,PCA就是将高维的数据通过线性变换投影的方式映射到低维空间上去,并且保证在投影的维度上,原数据的信息量最大(损失最小)。PCA的具体步骤1.特征中心化。每一维
  • 2024-09-21[神经网络与深度学习笔记]LDA降维
    LDA降维LinearDiscriminantAnalysis线性判别分析,是一种有监督的线性降维算法。与PCA保持数据信息不同,LDA的目标是将原始数据投影到低维空间,尽量使同一类的数据聚集,不同类的数据尽可能分散步骤:计算类内散度矩阵\(S_b\)计算类间散度矩阵\(S_w\)计算矩阵\(S_w^{-1}S_b\)对矩
  • 2024-09-13降维算法 0基础小白也能懂(附代码)
    降维算法0基础小白也能懂(附代码)原文链接啥是降维算法在互联网大数据场景下,我们经常需要面对高维数据,在对这些数据做分析和可视化的时候,我们通常会面对「高维」这个障碍。在数据挖掘和建模的过程中,高维数据也同样带来大的计算量,占据更多的资源,而且许多变量之间可能存在相关性
  • 2024-09-10亦菲喊你来学机器学习(20) --PCA数据降维
    文章目录PCA数据降维一、降维二、优缺点三、参数四、实例应用1.读取文件2.分离特征和目标变量3.使用PCA进行降维4.打印特征所占百分比和具体比例5.PCA降维后的数据6.划分数据集7.训练逻辑回归模型8.评估模型性能总结PCA数据降维主成分分析(PrincipalCompon
  • 2024-09-09机器学习入门基础:SVD(奇异值分解),看这篇就够了
    本文讲解机器学习的降维部分,包括SVD(奇异值分解)。1.1降维概述1.1.1维数灾难维数灾难(CurseofDimensionality):通常是指在涉及到向量的计算的问题中,随着维数的增加,计算量呈指数倍增长的一种现象。在很多机器学习问题中,训练集中的每条数据经常伴随着上千、甚至上万个特征。要处
  • 2024-09-07机器学习-基本方式
    文章目录一、有监督学习(SupervisedLearning)1.定义2.特点3.应用场景4.常见算法:二、无监督学习(UnsupervisedLearning)1.定义2.特点3.应用场景4.常见算法三、有监督学习与无监督学习的区别有监督学习和无监督学习是机器学习中的两种基本学习方式,它们在数据处理、模型
  • 2024-09-07《机器学习》PCA数据降维 推导、参数讲解、代码演示及分析
    目录一、主成分分析1、什么是主成分分析?2、什么是降维?3、如何进行主成分分析        1)数据标准化        2)计算协方差矩阵        3)计算特征值和特征向量        4)选择主成分        5)构建投影矩阵        6)数据降
  • 2024-09-06机器学习:对数据进行降维(PCA和SVD)
    目录前言一、PCA1.PCA是什么?2.PCA的实现使用步骤3.PCA参数解释4.代码实现5.PCA的优缺点二、SVD1.SVD是什么?2.SVD的实现步骤3.代码实现总结前言        数据降维是将高维数据转换为较低维度的过程,同时尽量保留数据中的关键信息。这有助于减少计算复杂性
  • 2024-09-06使用SVD(奇异值分解)进行降维的奇妙之旅
    在数据分析和机器学习的广阔天地中,降维技术占据着举足轻重的地位。当我们面对高维数据时,不仅计算成本高昂,而且容易遭遇“维度灾难”,即随着维度的增加,数据的稀疏性和距离度量失效等问题愈发严重。为了克服这些挑战,各种降维技术应运而生,其中奇异值分解(SingularValueDecompositi
  • 2024-09-05《机器学习》—— PCA降维
    文章目录一、PCA降维简单介绍二、python中实现PCA降维函数的介绍三、代码实现四、PCA降维的优缺点一、PCA降维简单介绍PCA(主成分分析,PrincipalComponentAnalysis)是一种常用的数据降维技术。它通过线性变换将原始数据转换到新的坐标系统中,使得任何投影的第一大方差
  • 2024-09-04【自学笔记】处理类别数据、独热编码和降维(主成分分析)
    类别数据  与数值特征不同,类别数据往往更难被计算机理解,主要分为序数和标称。  序数具有顺序,比如衣服尺码中有XL>L>M等  标称不含任何顺序,特征之间相互独立。处理序数特征  为了让算法正确解读序数特征,我们需要用整数来表示。我们可以定义映射关系,训练后再反向
  • 2024-09-03科研绘图系列:python语言tSNE散点图(tSNE scatter plot)
    介绍t-SNE(t-distributedStochasticNeighborEmbedding)是一种用于高维数据可视化的非线性降维技术。它由LaurensvanderMaaten和GeoffreyHinton在2008年提出。t-SNE的主要目的是将高维空间中的数据点映射到二维或三维空间中,同时尽可能保持数据点之间的相对距离,使得相
  • 2024-08-29Python实现等距映射(ISOMAP)降维算法
    目录Python实现等距映射(ISOMAP)降维算法的博客引言ISOMAP算法原理ISOMAP的优势与局限Python实现ISOMAP算法1.创建ISOMAP类2.在瑞士卷数据集上应用ISOMAP3.结果分析总结运行结果Python实现等距映射(ISOMAP)降维算法的博客引言在高维数据处理中,降维是一种常用的技
  • 2024-08-26Python实现局部线性嵌入(LLE)降维算法
    目录Python实现局部线性嵌入(LLE)降维算法的博客引言LLE算法原理1.确定邻域2.线性重构3.降维映射Python中的LLE实现1.创建LLE类2.实现瑞士卷数据集的LLE降维3.结果分析总结Python实现局部线性嵌入(LLE)降维算法的博客引言随着数据维度的增加,高维数据的分
  • 2024-08-26Python实现核主成分分析(KPCA)降维算法
    目录Python实现核主成分分析(KPCA)降维算法的博客引言KPCA算法原理1.核函数与核技巧2.中心化核矩阵3.特征分解Python中的KPCA实现1.创建KPCA类2.在瑞士卷数据集上应用KPCA3.结果分析总结Python实现核主成分分析(KPCA)降维算法的博客引言在高维数据分析中,主成
  • 2024-08-26数模国赛冲刺 | 数据预处理方法合集(特征工程、数据降维、数据划分、数据平衡)
    ​数据预处理方法合集(特征工程、数据降维、数据划分、数据平衡)本文继续介绍数据预处理中的特征工程、数据降维、数据划分、数据平衡的内容,接下来我们将详细地介绍具体的方法,文末可获得预处理方法合集PDF!目录特征工程特征选择(FeatureSelection)特征提取数据降维线性降
  • 2024-07-30线性代数中的降维方法
  • 2024-07-27因子分析法————数据降维
    因子分析法通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,起到了很好的降维作用目录一、因子分析与主成分分析的对比1.原理对比2.作用区别二、因子分析的实例三、因子分析的理论介绍1.因子分析的模型2.模型假设3.因子载荷矩阵的统计意义(1)A的行元
  • 2024-07-10PCA(主成分分析)--降维的基础算法
    一.原理简介PCA主成分分析,是一种使用较为广泛的数据降维算法,主要思想是将n维数据特征映射到k维上,这k维全新的正交数据特征称为主成分;PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据
  • 2024-07-09向量点乘为降维,叉乘为升维
    本文转自https://baijiahao.baidu.com/s?id=1787300641186091766&wfr=spider&for=pc总结:向量叉乘是诞生了一个新的方向,这个方向垂直于原向量组成的平面。点乘的好处是将高维降低到1维,可以在1个维度上讨论数值问题。如果1是点,那么乘积是线,如果1是线段,那么乘积是面积,如果1是向量
  • 2024-07-01降维 (Dimensionality Reduction) 原理与代码实例讲解
    降维(DimensionalityReduction)原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:降维技术,数据可视化,特征选择,PCA,t-SNE,SVD,机器学习1.背景介绍1.1问题的由来在数据分析和机器学习领域,面对高维度的数据集是一个普遍且
  • 2024-06-21ch10 降维与度量学习
    降维的动机从k-近邻算法的角度看降维如果给定测试样本\(x\)与最近邻样本\(z\),那么正确率就为\[P(acc)=P(c_1=c_2|x,z)=\sum{c\in\mathcal{C}}P(c_1=c_2=c|x,z)=\sum_{c\in\mathcal{C}}P(c_1=c|x)P(c_2=c|z)\]如果在度量空间中满足密采样假
  • 2024-06-18算法金 | 一个强大的算法模型:t-SNE !!
    大侠幸会,在下全网同名「算法金」0基础转AI上岸,多个算法赛Top「日更万日,让更多人享受智能乐趣」t-SNE(t-DistributedStochasticNeighborEmbedding)是一种用于降维和数据可视化的非线性算法。它被广泛应用于图像处理、文本挖掘和生物信息学等领域,特别擅长处理高维数
  • 2024-06-10特征降维&主成分分析
    1、特征降维是什么?降维是指在某些特定的限定条件下,降低随机变量(特征)的个数,得到一组“不相关”主变量过程相关特征:两个特征之间存在某些关系,例如降雨量和空气湿度是相关特征。2、特征降维的方法有哪些?Filter(过滤式)a)方差选择法:低方差特征过滤(例如判断鸟的种类中,特