常用的数据编码格式
utf-8、gbk、gb18030、gbk2312
引入模块
import pandas as pd
读取.csv文件代码结构
pd.read_csv(filepath_or_buffer, sep=’ ,’ , header=’infer’, index_col=None, usecols=None, engine=None, skiprows=None, nrows=None)
filepath_or_buffer: 文件地址。
sep: 分隔符,默认‘, ‘。
header: 个人认为这个参数可以不考虑。当没有列名时,会自动将列命名为int列表:0、1、2...;当有列名时显示列名。
usecols: 选定表的列。例:['header1', 'header19']
nrows: 选定表的行数。例:10
index_col: 默认None,将不使用列索引下标。否则,例:['h2','h1''h3']会将原来的['h1','h2','h3']列重新排序。
skiprows: 跳过某些行。例:[1,24,26]
读取.csv数据案例
简单的全部读取
pd.read_csv(filepath_or_buffer='baby_trade_history.csv')
重新排序列
pd.read_csv(filepath_or_buffer='baby_trade_history.csv',nrows=10,index_col=['auction_id','cat1','user_id'])
跳过第1、2行
pd.read_csv(filepath_or_buffer='baby_trade_history.csv',skiprows=[1,2])
只返回前10行
pd.read_csv(filepath_or_buffer='baby_trade_history.csv',nrows=10)
选择特定的列,且只显示前10行
pd.read_csv(filepath_or_buffer='baby_trade_history.csv',usecols=['user_id','cat_id','buy_mount','day'],nrows=10)
标签:库对,读取,filepath,buffer,None,read,pd,csv,pandas
From: https://www.cnblogs.com/cloucodeforfun/p/17023877.html