首页 > 编程语言 >python_批量处理excel文件

python_批量处理excel文件

时间:2023-10-12 13:55:32浏览次数:61  
标签:批量 python excel len json file path data

情况

 pip install openpyxl
 pip install xlrd

数据

 Excel文件的格式为xls和xlsx,pandas读取excel文件需要安装依赖库xlrd和openpyxl。
 !注意:当xlrd>=2.0时,只支持xls格式,不再支持xlsx。

数据代码

import pandas as pd
import os
import json

if __name__ =="__main__":
    excel_dir_path = r"D:\tic_info"
    excel_file_nm = r"test.xlsx"
	##读取excel
    excel_file_path = os.path.join(excel_dir_path,excel_file_nm)
    excel_data = pd.read_excel(io = excel_file_path,sheet_name=0,header=None)
    row_len = excel_data.shape[0]
    col_len = excel_data.shape[1]
    ##列名设置
    excel_data.columns = excel_data.iloc[row_len-2,:].tolist()
    #移除不需要的数据
    excel_data = excel_data.drop(labels=[row_len-1,row_len-2], axis=0)
    #
    print(excel_data.iloc[:,15:])
    ##数据类型转换
    excel_data["班级人数"] = excel_data["班级人数"].astype(int)
    # 获取批次的数据
    batch_nm = excel_data["班级地址"][0].split("/")[1]
    ## 对各个行进行求和
    data = excel_data.iloc[:, 15:].sum(axis=0)
    f_obj= {batch_nm:data.to_dict()}
    #print({batch_nm:data.to_dict()})
    json_file =r"D:\tic_info\static_js.json"
    with open(file=json_file, mode="a", encoding="utf8") as f_write:
        json.dump(f_obj, f_write, indent=4,ensure_ascii=False)

参考

 Python--pandas读取excel https://zhuanlan.zhihu.com/p/362709226

标签:批量,python,excel,len,json,file,path,data
From: https://www.cnblogs.com/ytwang/p/17759311.html

相关文章

  • Spring Boot + EasyExcel 导入导出,好用到爆,可以扔掉 POI 了
    1、EasyExcelEasyExcel是阿里巴巴开源poi插件之一,主要解决了poi框架使用复杂,sax解析模式不容易操作,数据量大起来容易OOM,解决了POI并发造成的报错。主要解决方式:通过解压文件的方式加载,一行一行的加载,并且抛弃样式字体等不重要的数据,降低内存的占用。EasyExcel优势注解式自定义操作......
  • 使用python来对字符编码序列进行互转
    排查字符集问题时,有的时候发生乱码不知道如何生成的字符,此时就需要通过字节序列来判断该字符是什么。已知utf8字节序列时,转换为unicode或者gb18030字节序列:>>>a=b'\xef\xbc\xa1'#此时a是一个bytes对象>>>b=a.decode("utf8")#此时b是一个str对象,内部是unicode的编码字......
  • Linux 中awk命令根据索引文件批量提取列和行
     001、批量提取列,根据索引index.txt文件批量提取2、4、8、9列[root@pc1test2]#lsa.txtindex.txt[root@pc1test2]#cata.txt##测试文件00100200300400500600700800901001101201301401501601701801902002102202302402502602......
  • SpringBoot + SpringBatch + Quartz整合定时批量任务
    1、引言最近一周,被借调到其他部门,赶一个紧急需求,需求内容如下:PC网页触发一条设备升级记录(下图),后台要定时批量设备更新。这里定时要用到Quartz,批量数据处理要用到SpringBatch,二者结合,可以完成该需求。由于之前,没有用过SpringBatch,于是上网查了下资料,发现可参考的不是很多,于是只能去......
  • 【Python&语义分割】Segment Anything(SAM)模型全局语义分割代码+掩膜保存(二)
    ​ 我上篇博文分享了SegmentAnything(SAM)模型的基本操作,这篇给大家分享下官方的整张图片的语义分割代码(全局),同时我还修改了一部分支持掩膜和叠加影像的保存。1SegmentAnything介绍1.1概况        MetaAI公司的SegmentAnything模型是一项革命性的技术,该模型能......
  • python模块之sys模块
    sys.argvsys模块是python解释器交互的一个接口该模块提供对解释器使用或维护的一些变量的访问和获取它提供了许多函数和变量来处理python运行时欢姐的不同部分importsysprint(sys.argv)test=sys.argv[1]iftest=="shawn":print("iamshawn")eliftest=="s......
  • 【Python&语义分割】Segment Anything(SAM)模型详细使用教程+代码解释(一)
    ​1SegmentAnything介绍1.1概况        MetaAI公司的SegmentAnything模型是一项革命性的技术,该模型能够根据文本指令或图像识别,实现对任意物体的识别和分割。这一模型的推出,将极大地推动计算机视觉领域的发展,并使得图像分割技术进一步普及化。    论文......
  • Excel 中使用数据透视图进行数据可视化
     使用数据透视表(PivotTable)是在Excel中进行数据可视化的强大工具。下面将提供详细的步骤来使用数据透视表进行数据可视化。**步骤一:准备数据**首先,确保你有一个包含所需数据的Excel表格。数据应该按照一定的结构和格式组织,例如,每列是一个特定的字段,每行是一个数据记录。**步......
  • 交通标志识别系统python+TensorFlow+算法模型+Django网页+数据集
    一、介绍交通标志识别系统。技术涉及:Python编程语言开发TensorFlow搭建算法模型对数据集进行训练得到一个精度较高的模型文件Django开发网页端界面平台实现对58种交通标志图片进行识别二、效果图片展示三、演示视频and代码视频+代码+介绍:https://s7bacwcxv4.feishu.......
  • python 基础笔记-函数
    函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段·。   好处为: 一可以把程序中相对独立的功能模块抽取出来,减少重读代码的编写; 二是将来可以以重复的使用这些功能模块https://www.clw9335.com/zx/index-htm-page-5.html  定义一个函数 你可以定义一......