首页 > 其他分享 >深度学习--数据预处理

深度学习--数据预处理

时间:2024-07-28 08:56:30浏览次数:13  
标签:inputs -- NA write 深度 print csv data 预处理

数据预处理

import os
import pandas as pd
import torch
#创建csv文件
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
#往文件里写内容
with open(data_file,'w') as f:
    f.write('NumRooms,Alley,Price\n')
    f.write('NA,PAVE,127500\n')
    f.write('2.0,NA,106000\n')
    f.write('4.0,NA,178100\n')
    f.write('NA,NA,140000\n')
#通过pandas库读取csv文件
data=pd.read_csv(data_file)
print(data)
#数据处理
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]#iloc指的是indexlocation下标位置
#要先处理缺失字符串再处理缺失数字
inputs = pd.get_dummies(inputs, dummy_na=True)#增加的列 Alley_PAVE表示是均值,  Alley_nan表示不是数字-->对字符串处理
inputs = inputs.fillna(inputs.mean())#对数字型缺失填充均值
print(inputs)
#转为张量tensor
X = torch.tensor(inputs.to_numpy(dtype=float))
y = torch.tensor(outputs.to_numpy(dtype=float))
print(X)
print(y)
#最后输出的是64位常规的浮点型对于深度学习一般用32位后续会学!

2024/7/28

标签:inputs,--,NA,write,深度,print,csv,data,预处理
From: https://www.cnblogs.com/luckyhappyyaoyao/p/18327872

相关文章

  • 为什么老板现在要学习财务
    一、新常态经济。什么是“新常态”?现在企业赚钱越来越难,利润越来越薄,需要通过财务手段来精细化核算和精细化管理,民营企业已进入抠细节、抠成本、抠利润的时代,而财务是支撑企业精细化管理的核心工具。二、大数据时代。经营决策需要数据,数据则主要来自财务部门。财务部门是......
  • 请求出一个数组int[]的最大值{4,-1,9,10,23},并得到对应的下标
    publicclassshuzu05{//编写一个main方法publicstaticvoidmain(String[]args){//请求出一个数组int[]的最大值{4,-1,9,10,23},并得到对应的下标//思路分析//1.定义一个int数组int[]arr={4,-1,9,10,23};//2.假定max=arr......
  • Windows下使用Apache和mod_wsgi部署django项目
    一、安装Python确定好所需要的python版本。二、安装Apacheapache下载地址:http://httpd.apache.org/docs/current/platform/windows.html#down下载完成后做如下操作将apache解压后直接复制到你想安装的路径下1、更改httpd.conf文件,找到如下代码并更改路径DefineSRVROOT"E:......
  • 可靠地获取当前进程的TargetData
    在llvmlite中,需要TargetData的实例来获取对象的ABI大小。这是有道理的,因为对象的大小取决于字的大小和对齐方式。如果我想立即编译并使用当前进程中的代码,那么除了当前进程的目标数据之外,我不需要任何其他东西。文档似乎表明这将可靠地获取当前进程的目标数据。import......
  • 在 Django 中注册时未填充国家/地区字段
    当用户注册时,我想将他们的国家/地区添加到他们的个人资料中。但是,该字段在数据库中仍为空白,并且不会填充国家/地区。我是Django中的身份验证新手,因此其他方面可能是错误的。我认为顺序可能是问题所在?我真的不确定。Views.pydefget_country(ip):ifipin['127.0.0......
  • 需要在 Windows 10 上安装 Pyspark 的帮助
    我正在尝试在我的笔记本电脑上安装Pyspark并按照https://medium.com/@deepaksrawat1906/a-step-by-step-guide-to-installing-pyspark-on-windows完成所有步骤-3589f0139a30https://phoenixnap.com/kb/install-spark-on-windows-10当我去设置我的Spark......
  • 有没有办法在Python中使用OpenCV在边界框后面画一条线?
    我正在为我的本科论文编写一个应用程序,该应用程序从根本上允许使用OpenCV库跟踪视频源中的多个对象。为了进一步发展这个想法,我希望能够在屏幕上画一条线,显示边界框在我正在跟踪的对象周围的历史记录。我注意到没有排序用于执行此操作的内置函数,因此任何有关制作此类内容的......
  • 如何向 python pandas 数据透视表添加过滤器? (pd.read_excel)
    我正在尝试使用pandas库在python中重新创建我在Excel中制作的数据透视表。我试图用时间段作为过滤器来总结超过500k行的OD总行程数据。在Excel上,我只会执行行(O)、列(D)、值(行程)、过滤器(时间)。到目前为止,在python上我只有索引、列、值、aggfunc,但我不知道如何过滤。有......
  • Arduino 和 PyBluez 之间的蓝牙通信
    我正在尝试使用PythonPyBluez在ArduinoUno板(带有蓝牙扩展板)和我的Linux操作系统之间建立蓝牙通信。我已成功将我的笔记本电脑与Uno配对。我能够连接到开发板,但是开发板无法读取正在发送的数据,也无法发送数据。这是Arduino草图#include<SoftwareSerial.h>......
  • 有没有办法使用 NumPy.any() 函数查找 3xAny NumPy 数组中特定“列”的索引?
    我正在使用3D“图像”,并试图找出如何更有效地绘制独特连接区域(在本例中为血管)。我有1和2以及0的空格。我当前创建这些船只所在位置的地图的解决方案是创建一个数组,其中[1202120211220102](但是在3D中)将变成:[12031203......