首页 > 编程语言 >Python-使用openpyxl读取excel内容

Python-使用openpyxl读取excel内容

时间:2024-03-12 19:55:53浏览次数:24  
标签:rows openpyxl Python list excel cell ws row

1. 本篇文章目标

将下面的excel中的寄存器表单读入并构建一个字典

2. openpyxl的各种基本使用方法

2.1 打开工作簿

wb = openpyxl.load_workbook('test_workbook.xlsx')

2.2 获取工作簿中工作表名字并得到工作表

ws = wb[wb.sheetnames[0]]

wb.sheetnames 会返回一个列表,列表中是每个工作表的名称,数据类型为str。执行上述代码后ws就是获取的工作表。

2.3 读取某个单元格的值

d = ws.cell(row=1, column=1).value
print(d)

使用sheet.cell会返回cell对象,再使用cell.value才能返回单元格的值,执行上述代码的结果如下:

2.4 按行读取

按行读取可以用iter_rows()方法。

for row in ws.iter_rows():
    print(row)

执行上述代码的输出如下:

由图可知,该方法应当是一个迭代器,返回的是row是一个tuple,里边是各个单元格cell。可以按照如下方法获取每列的值。

import pprint as pp
excel_list = []
for row in ws.iter_rows():
    row = list(row)
    for i in range(len(row)):
        row[i] = row[i].value
    excel_list.append(row)

pp.pprint(excel_list)

这里用到了一个模块pprint,用来使打印出的列表、字典等美观易读。print结果如下:

可以看到已经将excel中的内容构建了一个列表,但是下边一些没有内容的行也读了进来,尽管每个单元的值是None,这是因为之前对下边的行做过编辑,然后又删掉,导致这些无内容的单元具有单元格格式,openpyxl会将这些单元格也识别进来,所以要想避免这种情况,使用xlrd库是一种办法,或者采用下面的办法:

excel_list = []
for row in ws.iter_rows():
    row = list(row)
    if row[3].value != None:
        for i in range(len(row)):
            row[i] = row[i].value
        excel_list.append(row)

pp.pprint(excel_list)

执行结果如下,可以看到全为None的行被过滤掉了。

按列读取方法类似,使用iter_cols()。

2.5切片读取

有时候我们并不想读取表格里的全部内容,只想读取一部分,这时候可以用iter_rows()和iter_cols()的切片功能。

excel_list = []
for row in ws.iter_rows(min_row=2, min_col=2, max_row=3, max_col=3):
    row = list(row)
    if row[1].value != None:
        for i in range(len(row)):
            row[i] = row[i].value
        excel_list.append(row)

pp.pprint(excel_list)

执行结果如下,可以看到只获取了表格二行二列至三行三列的内容。

2.6 利用表格行列坐标直接获取单元格、单元格的值、切片

除了上述使用sheet.cell(row, col)来获取单元格值,以及iter_rows/cols获取行、列、切片外,还可以直接用excel的行列坐标表示来获取上述内容。

pp.pprint(ws['B3'])  #获取B3单元格的cell对象
pp.pprint(ws['B3'].value) #获取B3单元格cell对象的值
pp.pprint(ws['A1':'B2']) # 获取A1:B2这个切片的cell们
pp.pprint(ws['A:B']) # 获取A列到B列的所有cell对象
pp.pprint(ws[1:2]) # 获取行1到行2两行的所有cell对象

这里要注意使用这种切片、获取行列对象值的时候不能直接用.value方法,.value只是单独cell即一个单元格的cell时才能直接用,所以要想用这种方法获取切片、行列的值时要配合遍历、列表等方法构建。

2.7快速获得工作表的行们和列们

使用sheet.rows 和sheet.cols。

pp.pprint(list(ws.rows))

执行结果如下:

3.构建本任务所需字典

代码如下:

class ReadRegListExcel:
    def __init__(self, this_ws):
        self.reg_dic = {}
        self.ws = this_ws

    def excel_max_rows(self):
        max_rows = 0
        for row in ws.rows:
            if row[3].value != None:
                max_rows += 1
        return max_rows

    def construct_dic(self):
        max_rows = self.excel_max_rows()
        self.reg_dic['module name'] = self.ws.cell(row=1, column=2).value
        self.reg_dic['module base address'] = self.ws.cell(row=1, column=4).value
        self.reg_dic['registers'] = []
        row = 3
        all_rows = list(self.ws.rows)
        print(all_rows)
        while row <= max_rows:
            if all_rows[row-1][0].value != None:
                self.reg_dic['registers'].append({})
                self.reg_dic['registers'][-1]['register name'] = all_rows[row-1][0].value
                self.reg_dic['registers'][-1]['register address'] = all_rows[row-1][1].value
                self.reg_dic['registers'][-1]['fields'] = [[value.value for value in all_rows[row-1][2:7]]]
            else:
                self.reg_dic['registers'][-1]['fields'].append([value.value for value in all_rows[row-1][2:7]])
            row += 1
        return self.reg_dic

if __name__ == "__main__":
    reg_dic_obj = ReadRegListExcel(ws)
    reg_dic = reg_dic_obj.construct_dic()
    pp.pprint(reg_dic)

最后得到的寄存器字典如下:

至此读入寄存器列表文件并构建出结构化的寄存器字典任务完成。

标签:rows,openpyxl,Python,list,excel,cell,ws,row
From: https://www.cnblogs.com/xiaoguoic/p/18069103

相关文章

  • Python基于微博的舆论分析,舆论情感分析可视化系统(V5.0),附源码
    博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌......
  • Python的特性——跟老吕学Python编程
    Python的特性——跟老吕学Python编程Python的特性1.Python易学易用2.Python是解释型语言3.Python是交互式的4.Python是一种多范式语言5.Python的标准库6.Python是开源的7.Python是跨平台的8.用于GUI应用程序的Python9.Python的数据库连接10.Python是可扩展的11.Python拥......
  • Python毕业设计 人工智能与大数据专业毕业设计(论文)选题题目
    目录前言毕设选题人工智能大数据选题迷茫选题的重要性更多选题指导最后 前言  ......
  • Python基础_多进程数据共享
    Python基础_多进程数据共享一、多进程数据共享二、使用multiprocessing.Manager对象三、使用multiprocessing.Value和multiprocessing.Array四、使用管道和队列五、使用共享内存六、注意事项一、多进程数据共享Python中,多进程之间的数据共享是一个复杂的主题,因为每个......
  • python 递归比较两个文件夹
    以下importfilecmp,osdefcompare_folders(folder1,folder2):dcmp=filecmp.dircmp(folder1,folder2)fornameindcmp.left_only:print(f"{folder1}单独存在的文件:{name}")fornameindcmp.right_only:print(f"{folder......
  • Python函数每日一讲 - id()
    引言几天不见,今天我们来看看一个比较特别的函数id(),这个函数就是用来获取对象在内存中的唯一标识符的函数。语句概览id()函数是Python内置函数之一,用于获取对象在内存中的唯一标识符。其语法格式如下:id(object)其中,object参数是要获取标识符的对象。函数实例例1:获取整数......
  • macOS 下使用 pyenv 安装 python 2.n.p 报错,ERROR: The Python zlib extension was no
    TL;DR执行brewinstallzlib安装zlib之后,根据安装信息提示将一下三行变量exportLDFLAGS="-L/opt/homebrew/opt/zlib/lib"exportCPPFLAGS="-I/opt/homebrew/opt/zlib/include"exportPKG_CONFIG_PATH="/opt/homebrew/opt/zlib/lib/pkgconfig"加入到~/.zsh......
  • python得scrapy提取数据 xpath注意事项
    在提取器过滤数据这个地方被坑了很久,确实有点坑,有点难以理解,多注意下就可以了。frommultiprocessingimportallow_connection_picklingfromscrapy.spidersimportSpiderfrom..itemsimportCnblogshaha01ItemclasscnblogSpider(Spider):name="cnblogsHAHA01"#定......
  • Python 列表中任意字符串是否存在的判断
    `importsysjudge_string=[]target_string=sys.argvjudge_string=['-?','/?','--?','-help','--help','help']target_string=sys.argvjudge_result=any(wordifwordintarget_stringelseFals......
  • Python - whl文件是什么?怎么安装?
    whl文件是什么?.whl文件是Python分发的一种标准内置包格式,通常称为“轮子(wheel)”。123这种格式允许Python用户安装和分发第三方库,.whl文件包含了Python模块的压缩形式(.py文件和经过编译的.pyd文件)以及这些模块的元数据。它们通常通过Zip压缩算法进行压缩,可以......