数据预处理

import os
import pandas as pd
import torch
#创建csv文件
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
#往文件里写内容
with open(data_file,'w') as f:
    f.write('NumRooms,Alley,Price\n')
    f.write('NA,PAVE,127500\n')
    f.write('2.0,NA,106000\n')
    f.write('4.0,NA,178100\n')
    f.write('NA,NA,140000\n')
#通过pandas库读取csv文件
data=pd.read_csv(data_file)
print(data)
#数据处理
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]#iloc指的是indexlocation下标位置
#要先处理缺失字符串再处理缺失数字
inputs = pd.get_dummies(inputs, dummy_na=True)#增加的列 Alley_PAVE表示是均值，  Alley_nan表示不是数字-->对字符串处理
inputs = inputs.fillna(inputs.mean())#对数字型缺失填充均值
print(inputs)
#转为张量tensor
X = torch.tensor(inputs.to_numpy(dtype=float))
y = torch.tensor(outputs.to_numpy(dtype=float))
print(X)
print(y)
#最后输出的是64位常规的浮点型对于深度学习一般用32位后续会学！

2024/7/28

标签：inputs,--,NA,write,深度,print,csv,data,预处理
From： https://www.cnblogs.com/luckyhappyyaoyao/p/18327872

为什么老板现在要学习财务
一、新常态经济。什么是“新常态”？现在企业赚钱越来越难，利润越来越薄，需要通过财务手段来精细化核算和精细化管理，民营企业已进入抠细节、抠成本、抠利润的时代，而财务是支撑企业精细化管理的核心工具。二、大数据时代。经营决策需要数据，数据则主要来自财务部门。财务部门是......
请求出一个数组int[]的最大值{4，-1，9，10，23}，并得到对应的下标
publicclassshuzu05{//编写一个main方法publicstaticvoidmain(String[]args){//请求出一个数组int[]的最大值{4，-1，9，10，23}，并得到对应的下标//思路分析//1.定义一个int数组int[]arr={4,-1,9,10,23};//2.假定max=arr......
Windows下使用Apache和mod_wsgi部署django项目
一、安装Python确定好所需要的python版本。二、安装Apacheapache下载地址：http://httpd.apache.org/docs/current/platform/windows.html#down下载完成后做如下操作将apache解压后直接复制到你想安装的路径下1、更改httpd.conf文件，找到如下代码并更改路径DefineSRVROOT"E:......
可靠地获取当前进程的TargetData
在llvmlite中，需要TargetData的实例来获取对象的ABI大小。这是有道理的，因为对象的大小取决于字的大小和对齐方式。如果我想立即编译并使用当前进程中的代码，那么除了当前进程的目标数据之外，我不需要任何其他东西。文档似乎表明这将可靠地获取当前进程的目标数据。import......
在 Django 中注册时未填充国家/地区字段
当用户注册时，我想将他们的国家/地区添加到他们的个人资料中。但是，该字段在数据库中仍为空白，并且不会填充国家/地区。我是Django中的身份验证新手，因此其他方面可能是错误的。我认为顺序可能是问题所在？我真的不确定。Views.pydefget_country(ip):ifipin['127.0.0......
需要在 Windows 10 上安装 Pyspark 的帮助
我正在尝试在我的笔记本电脑上安装Pyspark并按照https://medium.com/@deepaksrawat1906/a-step-by-step-guide-to-installing-pyspark-on-windows完成所有步骤-3589f0139a30https://phoenixnap.com/kb/install-spark-on-windows-10当我去设置我的Spark......
有没有办法在Python中使用OpenCV在边界框后面画一条线？
我正在为我的本科论文编写一个应用程序，该应用程序从根本上允许使用OpenCV库跟踪视频源中的多个对象。为了进一步发展这个想法，我希望能够在屏幕上画一条线，显示边界框在我正在跟踪的对象周围的历史记录。我注意到没有排序用于执行此操作的内置函数，因此任何有关制作此类内容的......
如何向 python pandas 数据透视表添加过滤器？ (pd.read_excel)
我正在尝试使用pandas库在python中重新创建我在Excel中制作的数据透视表。我试图用时间段作为过滤器来总结超过500k行的OD总行程数据。在Excel上，我只会执行行（O）、列（D）、值（行程）、过滤器（时间）。到目前为止，在python上我只有索引、列、值、aggfunc，但我不知道如何过滤。有......
Arduino 和 PyBluez 之间的蓝牙通信
我正在尝试使用PythonPyBluez在ArduinoUno板（带有蓝牙扩展板）和我的Linux操作系统之间建立蓝牙通信。我已成功将我的笔记本电脑与Uno配对。我能够连接到开发板，但是开发板无法读取正在发送的数据，也无法发送数据。这是Arduino草图#include<SoftwareSerial.h>......
有没有办法使用 NumPy.any() 函数查找 3xAny NumPy 数组中特定“列”的索引？
我正在使用3D“图像”，并试图找出如何更有效地绘制独特连接区域（在本例中为血管）。我有1和2以及0的空格。我当前创建这些船只所在位置的地图的解决方案是创建一个数组，其中[1202120211220102](但是在3D中）将变成：[12031203......

深度学习--数据预处理

数据预处理

相关文章

赞助商

阅读排行