首页 > 其他分享 >pandas库对数据的读取

pandas库对数据的读取

时间:2023-01-04 09:45:40浏览次数:49  
标签:库对 读取 filepath buffer None read pd csv pandas

常用的数据编码格式

utf-8、gbk、gb18030、gbk2312

引入模块

import pandas as pd

读取.csv文件代码结构

pd.read_csv(filepath_or_buffer, sep=’ ,’ , header=’infer’,  index_col=None, usecols=None, engine=None, skiprows=None, nrows=None)
filepath_or_buffer: 文件地址。
sep: 分隔符,默认‘, ‘。
header: 个人认为这个参数可以不考虑。当没有列名时,会自动将列命名为int列表:0、1、2...;当有列名时显示列名。
usecols: 选定表的列。例:['header1', 'header19']
nrows: 选定表的行数。例:10
index_col: 默认None,将不使用列索引下标。否则,例:['h2','h1''h3']会将原来的['h1','h2','h3']列重新排序。
skiprows: 跳过某些行。例:[1,24,26]

读取.csv数据案例

简单的全部读取

pd.read_csv(filepath_or_buffer='baby_trade_history.csv')

image

重新排序列

pd.read_csv(filepath_or_buffer='baby_trade_history.csv',nrows=10,index_col=['auction_id','cat1','user_id'])

image

跳过第1、2行

pd.read_csv(filepath_or_buffer='baby_trade_history.csv',skiprows=[1,2])

image

只返回前10行

pd.read_csv(filepath_or_buffer='baby_trade_history.csv',nrows=10)

image

选择特定的列,且只显示前10行

pd.read_csv(filepath_or_buffer='baby_trade_history.csv',usecols=['user_id','cat_id','buy_mount','day'],nrows=10)

image

标签:库对,读取,filepath,buffer,None,read,pd,csv,pandas
From: https://www.cnblogs.com/cloucodeforfun/p/17023877.html

相关文章