首页 > 编程语言 >独热编码Python实现

独热编码Python实现

时间:2024-10-27 13:16:48浏览次数:7  
标签:编码 drop 变量 Python fields 独热 pd each data

test_data
seasonmonth
11
12
13
24
25
26
37
38
39
410
411
412

1-4 代表4个季节;1-12代表12个月。

import pandas as pd

data_path = 'test_dada.csv'  # 读取数据到内存
data = pd.read_csv(data_path)

dummy_fields = ['season', 'month'] # 所有类型编码变量的名称
for each in dummy_fields:
    # 取出所有类型变量,并将它们转变为独热编码
    dummies = pd.get_dummies(data[each], prefix=each, drop_first=False)
    # 将新的独热编码变量与原有的所有变量合并到一起
    data = pd.concat([data, dummies], axis=1)
    
# 将原来的类型变量从数据表中删除
fields_to_drop = ['season', 'month'] # 要删除的类型变量的名称
data = data.drop(fields_to_drop, axis=1) # 将它们从数据库的变量中删除

代码运行后,生成

season_1season_2season_3season_4month_1month_2month_3month_4month_5month_6month_7month_8month_9month_10month_11month_12
1000100000000000
1000010000000000
1000001000000000
0100000100000000
0100000010000000
0100000001000000
0010000000100000
0010000000010000
0010000000001000
0001000000000100
0001000000000010
0001000000000001

标签:编码,drop,变量,Python,fields,独热,pd,each,data
From: https://blog.csdn.net/L_DDDDD/article/details/143267334

相关文章

  • 【毕设论文】美食推荐系统Python-Django
       博主介绍:......
  • Python工程数学7VPython制作3D图形和动画(上)坐标系、基本形状、点和线
    7简介VPython是一个基于Python语言的开源库,专门用于创建三维图形和动画。它为用户提供了一种简单而直观的方式,通过Python代码构建出生动的三维场景。VPython的设计初衷是让用户能够轻松地将物理概念可视化,因此在教学、科研和学习物理等领域得到了广泛应用。VPython的特点易......
  • Python实现ARIMA的神经网络模型
    以下是一个使用Python实现ARIMA(自回归移动平均模型)的简单示例代码。在运行代码之前,请确保已经安装了pandas、numpy和statsmodels库。importnumpyasnpimportpandasaspdfromstatsmodels.tsa.arima.modelimportARIMAimportmatplotlib.pyplotasplt#生成一些......
  • (开题)flask框架渔具管理系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着垂钓活动的普及与钓鱼爱好者群体的扩大,渔具市场迎来了前所未有的发展机遇。然而,传统的渔具管理方式大多依赖于人工记录和简单的电子表......
  • (开题)flask框架在线疫苗预约系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景近年来,随着公共卫生意识的普遍提升和疫苗技术的不断进步,疫苗接种已成为预防传染病、保障民众健康的重要手段。然而,传统的疫苗预约方式往往......
  • Python 爬虫如何获取 JS 生成的 URL 和网页内容
    Python爬虫获取JS生成的URL和网页内容需要掌握1、网络请求分析、2、Selenium与浏览器驱动使用、3、动态数据抓取策略。以网络请求分析为例,首先,使用开发者工具监控网络请求,抓取和解析JavaScript发出的实际请求。一、网络请求分析在提取JavaScript生成的URL时,分析是关键步骤。开启......
  • Stema练习题:十四届蓝桥杯STEMA考试Python真题试卷题解
    来源:十四届蓝桥杯STEMA考试Python真题试卷第一套编程第四题这个程序虽然代码量不大,但综合运用了多种基础算法和数据结构:贪心策略选择窗口、模拟现实过程、线性查找最小值、效率高(时间复杂度为O(N)O(N)O(N))。题目描述:编程实现:某服务大厅同时开放3个窗口为客户办理......
  • (开题)flask框架学校团购系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景近年来,随着互联网的飞速发展和电子商务的普及,团购作为一种新兴的购物方式,因其价格优惠、购买便捷等优势,受到了广大消费者的青睐。特别是在......
  • python垃圾回收机制(十分重要)
    python垃圾回收机制总概​ python采用的是引用计数机制为主,标记-清除和分代收集两种机制为辅的策略,在Python内部记录着所有使用中的对象各有多少引用。​ 在C/C++中采用用户自己管理维护内存的方式。自己管理内存极其自由,可以任意申请内存,但也为大量内存泄露、悬空指针等bug......
  • (开题)flask框架校园二手物品交易网站(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景在当今社会,随着物质生活的丰富和消费观念的转变,校园内二手物品的交换和转让变得越来越频繁。然而,传统的二手物品交易方式往往依赖于口口相......