首页 > 编程语言 >盘点一个Python自动化办公的问题

盘点一个Python自动化办公的问题

时间:2024-06-17 13:10:24浏览次数:28  
标签:df Python merge 盘点 办公 瑜亮 逆光 筛选

大家好,我是Python进阶者。

一、前言

前几天在Python铂金交流群【逆光】问了一个Python自动化办公的问题,问题如下:问题 我现在有两个表a、b ,for 循环a、b ,如果a的条件满足b,则把b的值赋给a ,目前a有7万条数据,b有300条。我写的代码20分钟都没跑完。这是代码,请问改怎么解决?

image.png

二、实现过程

这里【瑜亮老师】给了个思路如下:

【瑜亮老师】:数据是在df中?

【逆光 】嗯嗯,是的

【瑜亮老师】:那你不能这么写,熊猫一见for循环,思路基本就玩完。

【逆光 】:请问那咋整呢?

【瑜亮老师】:你的需求是根据jd mergeTotal['付款公司编码']列中元素 在 JD_zhekou中查找对应的公司名。结果保存在jd_mergeTotal['公司']列中,Total['付款公司编码']列是和zhekou['公司组织编码']对应的,都是公司的组织编码。

【逆光 】:对的,本来可以用merge 但是后期可能会添加total的单量满足折扣的条件才能匹配,所以我用了for循环。

【瑜亮老师】:先merge,后期如果需要添加条件,只需要加一行对结果的筛选即可。

【逆光 】:对结果的筛选?

【瑜亮老师】:先筛选,后merge。这样可以减少运算时间。而先merge后筛选,可以复用merge后的df,做更多筛选动作。看你的需求了。

【逆光 】:因为我是初学哈,我不是很懂,如果先merge 那不是一对多了吗?

【瑜亮老师】:什么一对多?

【逆光 】:第二个表,可能是这样啊,如果加入单量条件的话,主键编号就不是唯一的了。如果是多个关键字连接的话,单量是个范围,怎么弄进行判断呢?

【瑜亮老师】:远程吧,或者你发一个脱敏的两个表的数据。最好是你发一个脱敏数据。

【不上班能干啥!】:如果先merge,就匹配完再筛选。先筛选再匹配跟上面的结果是一样的,只是先merge过程产生的数据会多。别说加一个单量条件了,你加很多的条件也是这样的,总之先merge。

【瑜亮老师】:是的,先筛选省时,先merge可多次筛选。

【逆光 】:先merge ,后再筛选,咋个筛选呢?

【瑜亮老师】:主要是根据需求。如果只是筛选一次,那就先筛选。如果后期还是会有各种筛选,那就先merge。你发一个脱敏数据吧。无非是两行代码先后顺序的问题,这个不用纠结。

【逆光 】:我不知道怎么弄筛选?

【不上班能干啥!】:new_df = df1.merge(df2) new_df = new_df[new_df['判断列'] = 条件],不就这样吗,等于,大于,小于,包含,没别的了。

【逆光 】:我好像懂你的意思了,我去试一试。

【小小明】:你发个测试数据,我可以帮你写。。。你可以想个可能出现的条件,可以不用merge。给出的具体代码如下:

companies = []
nums = []
for row in jd_MergeTotal.itertuples(False):
    tmp = JD_zhekou.query(f"公司组织编码=='{row.公司编码}'")
    companies.append(tmp.公司.iat[0])
    discount_dest = None
    for _, _, num, discount in tmp.itertuples(False):
        min_v, max_v = map(int, num.split("-", maxsplit=1))
        if min_v <= row.单量 <= max_v:
            discount_dest = discount
            break
    nums.append(discount_dest)
jd_MergeTotal["公司"] = companies
jd_MergeTotal["折扣"] = nums
jd_MergeTotal

[图片上传失败...(image-d60847-1718599326279)]

顺利地解决了粉丝的问题。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【斌】提出的问题,感谢【瑜亮老师】、【不上班能干啥!】、【小小明】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

image.png

标签:df,Python,merge,盘点,办公,瑜亮,逆光,筛选
From: https://www.cnblogs.com/dcpeng/p/18252176

相关文章

  • python3.10.10安装
    链接:https://www.python.org/选择一个盘建个python文件夹(任意盘,以E盘 python310为例,文件名任意字母数字下划线);安装包可分享路径不要太深E:\python310卸载uninstall 卸载之后可以把之前存储位置的文件夹(E:\python310)删除......
  • Python项目实战:制作一个翻译软件
    大家好,我是你们的老朋友南枫,今天咱们来学一个好玩、有趣、又实用的项目——制作一个翻译软件。我们参考的是有道翻译,首先还是老规矩,咱们先导入所需要使用到的模块:导入进来之后,我们需要把该要的参数,全都给copy下来(有请求头、cookie、防盗链等):既然我们是要做一个翻译的软......
  • Python中的属性
        Python中的属性主要分为类属性,对象属性。1.类属性    类属性:类所有,所有的实例对象都能够共享,能通过类名和实力对象名访问,当当前的类属性被实例对象通过对象名.属性名的形式调用之后,当前对象就会多出一个实例属性,此后使用对象名.属性名的形式调用的就是对象属......
  • 致远互联FE协作办公平台 ncsubjass SQL注入致RCE漏洞复现
    0x01产品简介致远互联FE协作办公平台是一款为企业提供全方位协同办公解决方案的产品。它集成了多个功能模块,旨在帮助企业实现高效的团队协作、信息共享和文档管理。0x02漏洞概述致远互联FE协作办公平台ncsubjass.jsp接口处存在SQL注入漏洞,未经身份验证的攻击者可以通过......
  • python-不定方程求解
    [题目描述]给定正整数 a,b,c。求不定方程ax+by=c 关于未知数 x 和y 的所有非负整数解组数。输入:一行,包含三个正整数 a,b,c,两个整数之间用单个空格隔开。每个数均不大于 1000。输出:一个整数,即不定方程的非负整数解组数。样例输入12318样例输出14来源/分类(难度系数:......
  • django 接入OIDC认证登录(django admin后台使用OIDC 或github账号登录) django 使用p
    参考文档模块文档:https://python-social-auth.readthedocs.io/en/latest/接入github账号登录参考:https://blog.csdn.net/yannanxiu/article/details/112622781;测试项目地址:https://github.com/AngelLiang/django-social-auth-demo/tree/main--创建githubOAuth应用:https:/......
  • Python 学习 第二册 第13章 数据库支持
    ----用教授的方法学习目录13.1Python 数据库 API 13.1.1 全局变量13.1.2 异常13.1.3 连接和游标13.1.4 类型13.2SQLite 和 PySQLite13.2.1 起步13.2.2 数据库应用程序示例13.1Python 数据库 API 为解决Python数据库模块存在的这种问题,人们一致同......
  • Python 学习 第二册 第14章 网络编程
    ----用教授的方式学习目录14.1 几个网络模块14.1.1 模块 socket14.1.2 模块 urllib 和 urllib214.1.3 其他模块14.2 SocketServer 及相关的类14.3.1 使用 SocketServer 实现分叉和线程化14.3.2 使用 select 和 poll 实现异步 I/O 14.4Twisted ......
  • python
    我是在金融行业做运维工作的,虽然对于python的技术要求并不高,但是深度掌握python绝对是非常重要的一项技能,可以有效地提高工作效率。如今工作快十年了,过去的许多年里我断断续续的学习了很多遍的python,可以说东一榔头西一棒槌,总之非常的不系统。因为应用场景不多,也经常是不断的遗......
  • Python使用.NET开发的类库来提高你的程序执行效率(包括.NET Framework、.NET Standard
    Python由于本身的特性原因,执行程序期间可能效率并不是很理想。在某些需要自己提高一些代码的执行效率的时候,可以考虑使用C#、C++、Rust等语言开发的库来提高python本身的执行效率。接下来,我演示一种使用.NET平台开发的类库,来演示一下Python访问.NET类库的操作实现。类库演示包括.......