首页 > 编程语言 >Python代码解压的中文文件名是乱码,怎么解决?

Python代码解压的中文文件名是乱码,怎么解决?

时间:2024-06-19 23:45:59浏览次数:16  
标签:解压 zip Python 乱码 file output path folder

大家好,我是Python进阶者。

一、前言

前几天在Python白银交流群【fashjon】问了一个Python自动化办公的问题,问题如下:

import zipfile

def unzip_file(zip_file_path, output_folder_path):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)

# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

以上代码解压的中文文件名是乱码,怎么解决?

二、实现过程

这里【瑜亮老师】给了个思路如下:乱码是什么样子的?最好能传上来一个压缩包,我们好试验。

过了几分钟,【瑜亮老师】补充道:@fashjon 我查看了一下zipfile的源码,发现是使用了'cp437'编码了文件名才导致的文件名错误。既然知道了错误的编码,那么方法就很简单了,1修改源码,2自己写代码读取解压缩路径中的文件名,重新使用'cp437'编码然后用gbk解码,重命名文件名,问题解决。修改后的代码如下:

import zipfile
import os
def unzip_file(zip_file_path, output_folder_path, encoding='gbk'):
    with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
        zip_ref.extractall(output_folder_path)
    # 遍历解压后的目录,检查并修正文件名
    for root, dirs, files in os.walk(output_folder_path):
        for bad_name in files:
            # 假设这里我们知道ZIP文件使用的是'gbk'编码(但实际情况可能不同)
            if not bad_name.isascii():  # 如果文件名包含非ASCII字符
                true_name = bad_name.encode('cp437').decode(encoding)
                os.rename(os.path.join(root, bad_name), os.path.join(root, true_name))
# 使用示例
zip_file_path = 'example.zip'
output_folder_path = 'output_folder'
unzip_file(zip_file_path, output_folder_path)

不确定你的电脑里是否安装pathlib,因此使用了os,顺利地解决了粉丝的疑问。

粉丝追问:解压文件用什么库比较好?

回答1:这方面我只知道zipfile和代码调用winrar。平时很少接触匹量处理压缩包。

image.png

回答2:批量处理压缩包,直接wps批量解压就可以了;

回答3:何须wps,只要电脑上装的有任意解压软件,全选压缩包,右键,可以解压到一个文件夹,也可以每个压缩包单独生成一个文件夹。代码只不过方便遍历多层文件夹目录,如果都在一个文件夹中,还不如右键点选更方便。

如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python自动化办公的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【fashjon】提出的问题,感谢【瑜亮老师】给出的思路,感谢【莫生气】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

image.png

标签:解压,zip,Python,乱码,file,output,path,folder
From: https://www.cnblogs.com/dcpeng/p/18257787

相关文章

  • Python基础知识:元组
    元组(Tuple)是Python中一种不可变的序列类型,这意味着一旦创建,元组中的元素就不能被更改。元组常用于存储多个值,当这些值不需要修改时使用,可以提高代码的安全性和性能。以下是关于Python元组的一些基础知识:创建元组元组通过逗号分隔的一系列值构成,并且通常用圆括号包围(虽然在只......
  • python金融实战教程pdf 目录
    python金融实战教程pdf目录:http://literalink.top/resource/detail/7186336410574524416第1章Python简介及安装11.1Python简介 11.2如何安装Python 31.3Python的不同版本 31.4运行Python的3种方式 41.4.1用GUI启动Python 41.4.2从Python命令行......
  • 【华为OD】D卷真题100分:IPv4地址转换成整数 python代码实现
    【华为OD】2024年C、D卷真题集:最新的真题集题库C/C++/Java/python/JavaScript【华为OD】2024年C、D卷真题集:最新的真题集题库C/C++/Java/python/JavaScript-CSDN博客JS、python、java、C、C++代码实现:【华为OD】D卷真题100分:IPv4地址转换成整数JavaScript代码实现-CSDN博......
  • 基于Python+Django的高校实验室管理系统设计与实现(源码+数据库+讲解)
    文章目录前言详细视频演示项目运行截图技术框架后端采用Django框架前端框架Vue可行性分析系统测试系统测试的目的系统功能测试数据库表设计代码参考数据库脚本为什么选择我?获取源码前言......
  • 基于Python+Django的高校成绩分析系统设计与实现(源码+数据库+讲解)
    文章目录前言详细视频演示项目运行截图技术框架后端采用Django框架前端框架Vue可行性分析系统测试系统测试的目的系统功能测试数据库表设计代码参考数据库脚本为什么选择我?获取源码前言......
  • python.:turtle库,Pillow库
    1. turtle库:优点: 简单易用,适合初学者入门。可以绘制基本的图形和动画。自带turtle绘图窗口,不需要安装额外的库。缺点:功能相对简单,适合绘制简单的图形。画笔速度较慢,对于复杂图形绘制可能不够高效。2.matplotlib库:优点: 功能强大,支持绘制各种类型的图表。提供丰富的样式......
  • Python 类
    Python类类的基础概念在Python中,类是面向对象编程(Object-OrientedProgramming,OOP)的核心构造之一。类是用于创建对象的蓝图或模板,它定义了一个对象应有的属性和方法。定义类是一种用户自定义的数据类型,它包含了数据(属性)以及操作这些数据的方法。通过定义类,我们可以创建具有......
  • python可视化2
    (二)、以(一)中的电子算盘为基础,设计并实现珠算测试器,并完成测试。【题目描述】给小朋友设计一个珠算测试器,要求能够完成珠算加减法的测试。具体的要求功能如下:(1) 用户启动测试,输入用户名后系统随机生成特定数目的加减法测试题;(2)要求测试使用表盘式或数字时秒表进行界面计时显......
  • python练习5
    (五)、设计并实现平面点类Point【题目描述】定义一个平面点类Point,对其重载运算符关系运算符,关系运算以距离坐标原点的远近作为基准,远的为大。程序完成对其的测试。【源代码程序】importmathclassPoint():    def__init__(self,x,y):        self.x=x  ......
  • python可视化
    (一)、设计实现电子算盘,并完成测试【题目描述】给小朋友设计一个电子算盘。要求绘制电子算盘界面,设计并实现打珠算过程(界面参考如下图示)。界面右侧要求以图形绘制的方式绘制自画像,注意不能是图像文件显示的形式。 【源代码程序】fromtkinterimport*definitWindow():  ......