首页 > 编程语言 >python中openpyxl给excel表去重和身份证号信息提取

python中openpyxl给excel表去重和身份证号信息提取

时间:2022-12-09 23:34:36浏览次数:48  
标签:__ 表去 openpyxl column 信息提取 sh value year wb

前言:

python操作excel用openpyxl库非常方便,今天学习一下给excel表去重,还有身份证号信息提取,自动计算年龄。


# coding:utf-8
from openpyxl import load_workbook
from openpyxl.styles import PatternFill

def dum():
wb = load_workbook("./加班时间.xlsx")
sh = wb.active
index =[] # 存储哪一行是重复数据
tmp = [] # 没有重复的数据
for i,c in enumerate(sh["B"]):
flag = c.value not in tmp
# print(flag, f'-----{c}======{tmp}')
if flag:
tmp.append(c.value)
else:
index.append(i)
fill = PatternFill('solid',fgColor='AEEEEE')
for i,r in enumerate(sh.rows):
if i in index:
for c in r:
c.fill =fill
print(f'第{i+1}条数据是重复数据')
wb.save('查找重复数据.xlsx')

if __name__ == '__main__':
dum()

python中openpyxl给excel表去重和身份证号信息提取_数据


# coding:utf-8
from openpyxl import load_workbook
from datetime import datetime

def creat_time():
now_year = datetime.now().year
wb = load_workbook('身份证号.xlsx')
sh = wb.active
max_column = sh.max_column
for i, cell in enumerate(sh['B']):
pno = cell.value
year = pno[6:10]
mouth = pno[10:12]
day = pno[12:14]
print(f'year:{year} mouth:{mouth} day:{day}')
age = now_year - int(year)
sh.cell(i+1, max_column + 1).value = year
sh.cell(i + 1, max_column + 2).value = mouth
sh.cell(i + 1, max_column + 3).value = day
sh.cell(i + 1, max_column + 4).value = age
wb.save('提取身份证号信息.xlsx')

if __name__ == '__main__':
creat_time()

python中openpyxl给excel表去重和身份证号信息提取_数据_02

标签:__,表去,openpyxl,column,信息提取,sh,value,year,wb
From: https://blog.51cto.com/u_14012524/5926680

相关文章

  • PYTHON - openpyxl (二)
    1.1写数据语句说明工作表["a1"]=值写数据到一个单元格工作表.cell(行,列).value=值写数据到一个单元格工作表.cell(行,列,value=值)同上工作表.......
  • PYTHON - openpyxl (一)
    1.1安装pipinstallopenpyxl1.2工作簿函数说明wb=load_workbook(filename)打开工作簿wb=Workbook()创建空白工作簿wb.save(filename)保存工......
  • 《python网络爬虫和信息提取》:中国大学排名(附更改前后的代码)
    python网络爬虫和信息提取  《python网络爬虫和信息提取》是北京理工大学的一门网络课程(中国大学MOOC(慕课))。    偶然机会我在网上学习了这门课程,中国大学......
  • 搜索引擎的那些事(title信息提取)
        前面我们在谈到搜索引擎的时候,说到了网页下载、说到了分词、说到了多线程。但是,我们要清楚这一切的目的都是为了在网页中获得重要的信息。如何从网页或者从链接中......
  • openpyxl 操作Excel
    1fromopenpyxlimportload_workbook23#加载excel4wb_obj=load_workbook(filename="test_data.xlsx")56#获取所有表单名称7sheet_name_list=wb_......
  • 通用文档信息提取模型浅析
    文章目录​​1.前言与痛点​​​​2.通用信息提取模型技术分析​​​​1.技术介绍​​​​2.原理分析​​​​1.LayoutDetection(视觉检测模块):​​​​2.OCR(文字识别......
  • 16、对列表去重
    题目:  输入,包含重复元素的原始列表:[30,50,40,20,50,40]  返回:[30,50,40,20] 解题思路:  1、定义一个新的空列表  2、遍历原始列表  3、加入判断条件......
  • 3.1 处理Excel文件的相关模块介绍及安装 openpyxl模块
    openpyxl模块安装方式在线安装方式:Windows用户:pipinstallopenpyxlMac用户:pip3installopenpyxl测试Windows用户打开命令行输入pythonMac用户打开终端......
  • requests模块及openpyxl模块简介
    昨日内容回顾正则表达式字符组字符组内部字符为并列关系。连续字符用'-'连接。特殊符号开头、结尾、数字、任意字符、字母数字下划线。量词多次、一次、指......
  • 第三方模块之request模块,openpyxl模块
    第三方模块下载#1.pip工具避免pip冲突我们在使用的时候可以添加对应的版本号下载第三方模块的句式pipinstall模块名下载第三方模块临时切......