介绍
t-SNE(t-distributed Stochastic Neighbor Embedding)是一种用于高维数据可视化的非线性降维技术。它由Laurens van der Maaten和Geoffrey Hinton在2008年提出。t-SNE的主要目的是将高维空间中的数据点映射到二维或三维空间中,同时尽可能保持数据点之间的相对距离,使得相似的数据点在低维空间中更接近,不相似的数据点则更分散。
t-SNE散点图是一种数据可视化技术,它通过t-SNE算法将高维数据降维到二维或三维空间,并以散点图的形式展示。这种图通常用于展示数据集中的模式、聚类和结构,使得数据的内在关系更加直观。
t-SNE散点图的特点:
- 非线性降维:t-SNE是一种非线性降维方法,它能够捕捉数据中的复杂结构,尤其是当数据在高维空间中具有非线性关系时。
- 局部结构保持:t-SNE特别强调保持数据点之间的局部结构,即相似的数据点在低维空间中更接近,不相似的数据点则更分散。
- 可视化效果:t-SNE散点图