首页 > 编程语言 >python对excel文件中指定表格的指定列数据进行去重复操作。

python对excel文件中指定表格的指定列数据进行去重复操作。

时间:2024-06-03 10:43:17浏览次数:24  
标签:01 sheet python Excel excel 指定 two df 流水

import pandas as pd

# 读取Excel文件
df_all = pd.read_excel('域名管理系统.xlsx', sheet_name=None, engine='openpyxl')

# 确保'01流水'表存在
if '01流水' in df_all:
    # 提取第1列第2行至第1000行的数据并去重
    df_two = df_all['01流水']
    unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True)

    # 检查并处理'01流水-去重'表
    if '01流水-去重' in df_all:
        # 删除原有的'01流水-去重'表
        del df_all['01流水-去重']

    # 将去重后的数据添加为新的'01流水-去重'表
    df_all['01流水-去重'] = unique_data

    # 保存更新后的Excel文件
    with pd.ExcelWriter('域名管理系统.xlsx', engine='openpyxl') as writer:
        for sheet_name, data_frame in df_all.items():
            data_frame.to_excel(writer, sheet_name=sheet_name, index=False)
else:
    print("Sheet '01流水-去重' not found in the Excel file.")

上述代码由阿里云lingma完成。

功能:将one.xlsx文件中表two中第1列第2行至1000行的数据进行去重,并将结果保存到two-uni表格,如果two-uni已存在,则删除原表格。

需要:我们可以使用pandas库来处理Excel文件。

pip install pandas openpyxl

 

标签:01,sheet,python,Excel,excel,指定,two,df,流水
From: https://www.cnblogs.com/POTUS/p/18228325

相关文章

  • python函数
    一、什么是函数定义:函数是组织好,可重复使用,用来实现单一,或关联功能的代码段二、pycharm中的表结构项目,包(init)或目录,py文件,py文件包含多个函数或类等三、函数的有哪些优点?1、降低代码冗余2、增加代码的复用性,提高开发效率3、提高程序的拓展性4、封装:就是把代码片段放在函......
  • 【Python】成功解决TypeError: string indices must be integers
    【Python】成功解决TypeError:stringindicesmustbeintegers 下滑即可查看博客内容......
  • 【Python】成功解决TypeError: ‘method’ object is not subscriptable
    【Python】成功解决TypeError:‘method’objectisnotsubscriptable 下滑即可查看博客内容......
  • python 提取手机号
    importre#导入正则表达式处理模块defget_phone(text):'''使用正则表达式提取文本中的手机号:paramtext:原始文本:return:手机号数组'''phones=re.findall(r'(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9}......
  • python 执行js 代码 一些库
    在Python中执行JavaScript代码,有几种常见的方法和库可以使用:PyExecJS:这是一个直接在Python中执行JavaScript代码的库。它支持多个JavaScript运行时(如Node.js、PhantomJS、JScript等)。importexecjsjs_code="""functionhello(){return'Hello,World......
  • 【Python】生成html文档-使用dominate
    原文地址:https://www.cnblogs.com/kaerxifa/p/13035376.htmldominate简介dominate是一个使用优雅的DOMAPI创建和操作HTML文档的Python库。使用它能非常简洁地编写纯Python的HTML页面,这消除了学习另一种模板语言的需要,利用Python更强大的特性。 首先安装依赖:pipinstall......
  • [ Python ] 常用运算符对应的魔法方法
    https://www.cnblogs.com/yeungchie/Python中的运算符丰富多样,它们可以分为多个类别,包括算术运算符、比较运算符、逻辑运算符、位运算符、身份运算符、成员运算符等。每个运算符都有其对应的魔法方法(也称为特殊方法或dunder方法,即双下划线方法),这些方法在特定情况下会被Python调用......
  • 利用PlugLink平台实现Python自动化办公
    利用PlugLink平台实现Python自动化办公自动化技术已经成为提升效率和减少人力成本的关键。特别是利用AI和Python语言的强大功能,企业可以实现高度定制化的自动化工作流程。PlugLink作为一个开源的办公自动化平台,正是为了满足这一需求而生。本文将通过一个具体的Python案例,介......
  • Python使用BeautifulSoup爬取人人影视的详情页面
    importrequests,jsonfrombs4importBeautifulSoupif__name__=='__main__':url="https://yyets.com/movies/201565/"headers={"User-Agent":"Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537......
  • 【Python基础】循环语句(5073字)
    文章目录@[toc]什么是循环Python中的循环方式while循环格式示例运行过程应用while循环嵌套示例1示例2for循环格式示例内置函数range()的用法range(x)range(x,y)range(x,y,z)应用break与continuebreakwhile循环中的break未使用break使用breakfor循环中的breakc......