首页 > 其他分享 >py

py

时间:2024-03-19 23:46:55浏览次数:22  
标签:features df py combined 聚类 iloc data

import pandas as pd
import numpy as np
from sklearn.preprocessing import OneHotEncoder
from sklearn.manifold import TSNE
import plotly.express as px

# 1. 加载数据并转化为DataFrame
data = pd.read_csv('ma2.csv', header=None)

# 假设第一列至第三列分别为年龄聚类、城市聚类和满意度体验聚类
features_df = data.iloc[:, :3]

# 2. 对类别特征进行独热编码
ohc = OneHotEncoder(sparse=False)
encoded_data = ohc.fit_transform(features_df)

# 3. 使用t-SNE进行降维
tsne_model = TSNE(n_components=2, random_state=42)
transformed_data = tsne_model.fit_transform(encoded_data)

# 将原始分类信息与降维后的数据结合
combined_data = pd.DataFrame(transformed_data, columns=['Dim_1', 'Dim_2'])
combined_data['Satisfaction'] = features_df.iloc[:, 2]
combined_data['Age'] = features_df.iloc[:, 0]
combined_data['City'] = features_df.iloc[:, 1]

# 4. 创建交互式散点图
fig = px.scatter(combined_data,
x='Dim_1',
y='Dim_2',
color='Satisfaction',
hover_data=['Age', 'City'],
title='t-SNE Visualization with Combined Features Colors (Interactive)',
labels={'Satisfaction': '满意度', 'Age': '年龄聚类', 'City': '城市聚类'})

fig.show()

标签:features,df,py,combined,聚类,iloc,data
From: https://www.cnblogs.com/azwz/p/18084233

相关文章

  • python
    importpandasaspdfromkmodes.kmodesimportKModes#读取csv文件data=pd.read_csv('ma1.csv')#数据预处理,将相关列合并为乘车满意度和其他满意度data['乘车满意度']=data[['售票服务','候车服务','乘车服务','下车服务']].sum(axis=1)data['其......
  • pyth
    importpandasaspdfromkmodes.kmodesimportKModesfromsklearn.metricsimportsilhouette_scoreimportmatplotlib.pyplotasplt#假设数据列名如下(请替换为实际的列名)columns=['售票服务','候车服务','乘车服务','下车服务','行李寄存和托运服务',&......
  • 3 python的数值在内存中如何存储
    python的数值在内存中如何存储 在Python中,数值在内存中的存储方式取决于数值的类型和大小,以及Python的版本。Python使用固定的字节数来表示整数类型,并且对于浮点数,通常使用双精度(64位)或者扩展精度(128位)的浮点表示。整数的存储方式:对于较小的整数,Python通常使用一个机器字长......
  • 详细分析Python模块中的雪花算法(附模板)
    目录前言1.基本知识2.模板3.Demo前言分布式ID的生成推荐阅读:分布式ID生成方法的超详细分析(全)1.基本知识Snowflake算法是一种用于生成全局唯一ID的分布式算法,最初由Twitter设计并开源它被设计用于解决分布式系统中生成唯一ID的需求,特别是在微服务架构和......
  • 【Python】使用selenium对Poe批量模拟注册脚本
    配置好接码api即可实现自动化注册登录试用一体。运行后会注册账号并绑定邮箱与手机号进行登录试用。测试结果30秒一个号importreimporttimeimportrequestsfrombs4importBeautifulSoupfromseleniumimportwebdriverfromselenium.webdriver.chrome.option......
  • Python 机器学习 HMM模型三种经典问题
    ​ 隐马尔可夫模型(HiddenMarkovModel,HMM)是一个强大的工具,用于模拟具有隐藏状态的时间序列数据。HMM广泛应用于多个领域,如语音识别、自然语言处理和生物信息学等。在处理HMM时,主要集中于三个经典问题:评估问题、解码问题和学习问题。三个问题构成了使用隐马尔可夫模型时的基础......
  • 一文了解Python中的运算
    Python的运算符和其他语言类似数学运算>>>print 1+9        # 加法>>>print 1.3-4      # 减法>>>print 3*5        # 乘法>>>print 4.5/1.5    # 除法>>>print 3**2       # 乘方     >>>print 10%3      ......
  • Python小白的福利之基本数据类型
    简单的数据类型以及赋值变量不需要声明Python的变量不需要声明,你可以直接输入:>>>a = 10那么你的内存里就有了一个变量a,它的值是10,它的类型是integer(整数)。在此之前你不需要做什么特别的声明,而数据类型是Python自动决定的。>>>print a>>>print type(a)那......
  • Python 数据持久层ORM框架 TorToise模块(异步)
    文章目录TortoiseORM简介TortoiseORM特性TortoiseORM安装TortoiseORM数据库支持TortoiseORM创建模型aerich迁移工具简介aerich迁移工具安装aerich迁移工具使用TrotoiseORM查询数据TrotoiseORM修改数据TrotoiseORM删除数据TrotoiseORM新增数据......
  • 【蓝桥杯选拔赛真题70】python最短路径和 第十五届青少年组蓝桥杯python选拔赛真题 算
    目录python最短路径和一、题目要求1、编程实现2、输入输出二、算法分析三、程序编写四、程序说明五、运行结果六、考点分析七、 推荐资料1、蓝桥杯比赛2、考级资料3、其它资料python最短路径和第十五届蓝桥杯青少年组python比赛选拔赛真题一、题目要求(注:i......