数据预处理
import os
import pandas as pd
import torch
#创建csv文件
os.makedirs(os.path.join('..','data'),exist_ok=True)
data_file=os.path.join('..','data','house_tiny.csv')
#往文件里写内容
with open(data_file,'w') as f:
f.write('NumRooms,Alley,Price\n')
f.write('NA,PAVE,127500\n')
f.write('2.0,NA,106000\n')
f.write('4.0,NA,178100\n')
f.write('NA,NA,140000\n')
#通过pandas库读取csv文件
data=pd.read_csv(data_file)
print(data)
#数据处理
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]#iloc指的是indexlocation下标位置
#要先处理缺失字符串再处理缺失数字
inputs = pd.get_dummies(inputs, dummy_na=True)#增加的列 Alley_PAVE表示是均值, Alley_nan表示不是数字-->对字符串处理
inputs = inputs.fillna(inputs.mean())#对数字型缺失填充均值
print(inputs)
#转为张量tensor
X = torch.tensor(inputs.to_numpy(dtype=float))
y = torch.tensor(outputs.to_numpy(dtype=float))
print(X)
print(y)
#最后输出的是64位常规的浮点型对于深度学习一般用32位后续会学!
2024/7/28
标签:inputs,--,NA,write,深度,print,csv,data,预处理 From: https://www.cnblogs.com/luckyhappyyaoyao/p/18327872