数据载入、存储及文件格式
文本格式数据的读写
函数 | 描述 |
---|---|
read_csv | 默认分隔符逗号 |
read_table | 制表符(’\t‘)是默认分隔符 |
read_excel | 从excel读取 |
read_json | 从JSON字符串读取 |
读取csv文件
df = pd.read_csv('examples/ex1.csv')
有些文件不包含表头,可以默认分配,也可以自己指定
pd.read_csv('ex2.csv',header=None) //默认分配
pd.read_csv('ex2.csv',names=['a','b','c','d']) //手动分配
如果你想让某一列成为行索引,可以传参给index_col
pd.read_csv('ex2.csv',names=names,index_col='d')
将数据写入文本格式
使用DataFrame的to_csv方法,可以将数据导出为逗号分隔的文件
frame1.to_csv('example/out.csv')
可以写入控制台,也可以指定其他分隔符
import sys
frame1.to_csv(sys.stdout, sep = '|')
缺失值输出时显示空,可以用其他值标注:
frame1.to_csv(sys.stdout, na_rep='NULL')
默认行和列标签都会写入,可以禁止写入
frame1.to_csv(sys.stdout, index=False,header=False)
也可以只写入列的子集,并指定顺序
frame1.to_csv(sys.stdout, index=False, columns=['a','b','c'])