首页 > 编程语言 >Python教程:pandas读写txt文件——DataFrame和Series

Python教程:pandas读写txt文件——DataFrame和Series

时间:2023-05-05 15:37:02浏览次数:27  
标签:index Python Series 读写 DataFrame df txt pandas

大家用pandas一般都是读写csv文件或者tsv文件,读写txt文件时一般就with open了,其实pandas数据类型操作起来更加方便,还是建议全用pandas这一套。

读txt文件代码如下,主要是设置正则表达式的分隔符(sep参数),和列名取消(header参数),以及不需要列索引(index_col)。

1 df = pd.read_csv("workloads/tpch_workload.txt", header=None,error_bad_lines=False,sep = r'\s+\n',index_col=0)

设分隔符是为了去除行末空格和多个空行;

设列名取消是防止把第一行的数据当做schema;

设索引取消是防止输出 df.iloc[i] 的时候给你输出一堆Series,就像下面这样:

 当然你也可以直接输出 df.iloc[i].name 来去掉Series的warper。输出 df 和 df.index 的结果如下,里面包含了一些不必要的warper:

 想要去掉结果的话,就用 df.index.value 即可,因为这个df读了txt之后本质上是空DataFrame,数据全都存在index里了。

 

标签:index,Python,Series,读写,DataFrame,df,txt,pandas
From: https://www.cnblogs.com/St-Lovaer/p/17374252.html

相关文章

  • python笔记-数据类型
    获取数据类型type(val)iftype(1)==int:print('1是int类型')iftype('hello')==str:print('1是字符串类型')iftype(1.5)==float:print('1是float类型')iftype([1,2])==list:print('1是list类型')类型转换prin......
  • Typora+MinIO+Python代码打造舒适协作环境
    作者:IT王小二博客:https://itwxe.com不知不觉大半年没更新了...前面小二介绍过使用Typora+MinIO+Java代码打造舒适写作环境,然后有很多大佬啊,说用Java来实现简直是杀鸡用上牛刀,小二想了想,确实有点...正好小二最近在学习Python,所以咱们就改用Python实现一版。安装MinIO安装参考......
  • python dingtalk钉钉群告警消息发布
    目录pythondingtalk钉钉群告警消息发布Dingtalk简介钉钉告警消息通知脚本pythondingtalk钉钉群告警消息发布公司用oprator部署的prometheus,理论上时可以直接通过alertmanager的配置。通过钉钉机器人的webhook向群里发送告警信息。但是想要格式化输出格式,并且规范化就成了问题......
  • 解决python配置环境变量后cmd窗口无法打开并弹出Microsoft store界面
    前言在一台新的机器上安装python并正确配置环境变量后,本来打算测试一下是否安装成功,结果在cmd窗口输入python执行后,没有出现版本信息,并会弹出Microsoftstore界面。反复检查了一下,环境变量确实已经正确配置了,但还是无法执行。后经查找资料解决了该问题,在此做下记录。......
  • Python使用虚拟环境
    本文来源:Python使用虚拟环境-钻芒博客(zuanmang.net)安装虚拟环境sudoapt-getupdatesudoapt-getinstallpython3-venv回到用户目录: cd~创建虚拟环境: python3-mvenvvenv激活虚拟环境: sourcevenv/bin/activate在激活的虚拟环境......
  • 批量修改Mac txt文件名 Python脚本
    本文来源:批量修改Mactxt文件名Python脚本-钻芒博客(zuanmang.net)需求:修改文件夹内所有txt文件的文件名称,如 钻芒博客1234_你好1234567.txt要求去掉_后边的名称,使其改成 钻芒博客1234.txt如果文件名称没有_,则不处理Python importosimportsubprocess #替......
  • 利用Python爬虫采集1688商品详情数据 +商品列表数据+商品API接口(支持全网)
    一、如何通过手动方式查看1688商品详情页面的数据1.1688商品详情API接口(item_get-获得1688商品详情接口),1688API接口代码对接可以获取到宝贝ID,宝贝标题,价格,掌柜名称,库存,最小购买数,宝贝链接,宝贝图片,品牌名称,商品详情,详情图片等页面上有的数据均可以获取到,手动方式如下:例......
  • Python NumPy 广播(Broadcast)
    广播(Broadcast)是numpy对不同形状(shape)的数组进行数值计算的方式,对数组的算术运算通常在相应的元素上进行。如果两个数组a和b形状相同,即满足a.shape==b.shape,那么a*b的结果就是a与b数组对应位相乘。这要求维数相同,且各维度的长度相同。importnumpyasnp"......
  • Python爬虫scrapy框架教程
    Scrapy是一个Python爬虫框架,用于提取网站上的数据。以下是使用Scrapy构建爬虫的基本步骤:安装Scrapy:在终端中运行pipinstallscrapy创建一个新项目:在终端中运行scrapystartprojectprojectname创建一个爬虫:在项目文件夹中运行scrapygenspiderspidername http://website.co......
  • Python爬虫scrapy框架教程
    Scrapy是一个Python爬虫框架,用于提取网站上的数据。以下是使用Scrapy构建爬虫的基本步骤:安装Scrapy:在终端中运行pipinstallscrapy创建一个新项目:在终端中运行scrapystartprojectprojectname创建一个爬虫:在项目文件夹中运行scrapygenspiderspidername http://website.com编......