1. python实现zip分卷压缩

WinHex 开始16进制一个一个文件对比 WinRar 创建的分卷压缩和单个 zip 文件的差异。

如果想把单个大文件 test.zip -> 分卷文件 test.z01、test.z02、test.zip

首先，在创建的第一个分卷文件 test.z01的前面加上 \x50\x4b\x07\x08 这个是分卷压缩的文件头(header)，占4个字节。其实单个压缩文件本身 header 就有这个了，而分卷压缩的需要两个emmm。之后便是从单个大压缩文件文件test.zip中读取 "一个分卷大小 -4 个字节"的数据，写入test.z01中，如何接着读取一个分卷大小的数据，写入test.z02，以此类推，最后一个分卷文件名也是test.zip

`1.1 代码如下：`

import os
import zipfile


def zip_by_volume(file_path, block_size):
    """zip文件分卷压缩"""
    file_size = os.path.getsize(file_path)  # 文件字节数
    path, file_name = os.path.split(file_path)  # 除去文件名以外的path，文件名
    suffix = file_name.split('.')[-1]  # 文件后缀名
    # 添加到临时压缩文件
    zip_file = file_path + '.zip'
    with zipfile.ZipFile(zip_file, 'w') as zf:
        zf.write(file_path, arcname=file_name)
    # 小于分卷尺寸则直接返回压缩文件路径
    if file_size <= block_size:
        return zip_file
    else:
        fp = open(zip_file, 'rb')
        count = file_size // block_size + 1
        # 创建分卷压缩文件的保存路径
        save_dir = path + os.sep + file_name + '_split'
        if os.path.exists(save_dir):
            from shutil import rmtree
            rmtree(save_dir)
        os.mkdir(save_dir)
        # 拆分压缩包为分卷文件
        for i in range(1, count + 1):
            _suffix = 'z{:0>2}'.format(i) if i != count else 'zip'
            name = save_dir + os.sep + file_name.replace(str(suffix), _suffix)
            f = open(name, 'wb+')
            if i == 1:
                f.write(b'\x50\x4b\x07\x08')  # 添加分卷压缩header(4字节)
                f.write(fp.read(block_size - 4))
            else:
                f.write(fp.read(block_size))
        fp.close()
        os.remove(zip_file)     # 删除临时的 zip 文件   
        return save_dir


if __name__ == '__main__':
    file = r"D:\Downloads\1.mp4"        # 原始文件
    volume_size = 1024 * 1024 * 100  # 分卷大小 100MB
    path = zip_by_volume(file, volume_size)
    print(path)     # 输出分卷压缩文件的路径

1.2 缺点：

该方法创建分卷压缩的时候，需要先在磁盘创建一个临时压缩包，然后将其拆分，实际上会对磁盘写入两次，这就浪费了时间。

当然，使用 ByteIO 进行字节流的压缩，但是这种方式需要先把文件读入内存，对于超级大的文件，这是不现实的，分分钟内存爆炸

2.解压

解压.ZIP分卷文件（亲测可用）

标签：分卷压缩,zip,文件,python,file,test,path
From： https://www.cnblogs.com/kn-zheng/p/18026579

python在B站爬糖豆广场舞
先附上代码：importrequests,refromlxmlimportetree#这是单页面下载，翻页的目前还不会url='https://search.bilibili.com/all?vt=96737335&keyword=%E7%B3%96%E8%B1%86%E5%B9%BF%E5%9C%BA%E8%88%9E'headers={'user-agent':'Mozilla/5.0(Window......
1.3 使用pip管理Python扩展库
常用pip命令使用方法pip命令示例说明pipfreeze[>packages.txt]列出已安装模块及其版本号，可使用重定向符>把扩展库信息保存到文件packages.txt中pipinstallSomePackage[==version]在线安装SomePackage模块，可以使用方括号内的形式指定扩展库版本pipinstallSo......
1.2 Python安装与简单使用
Python3.6.8安装Python官网：https://www.python.org/Python3.6.8官网：https://www.python.org/downloads/release/python-368/按照提示安装即可，安装完成后，按win+R打开命令行，输入python-V，出现版本号，说明安装成功在开始菜单中选择IDLE（PythonGUI）即可启动Python解释器......
1.1 如何选择Python版本
简介Python是一门解释型高级语言，支持伪编译可以把Python源程序转换为字节码来优化程序和提高运行速度，支持使用py2exe、py2app、cx_Freeze或pyinstaller工具将Python程序打包为不同平台上的可执行程序，可以在没有安装Python解释器和相关依赖包的系统中运行Python支持多版本并存......
Python练习案例_Pico Fermi Bagels猜数字游戏
案例介绍--《Python编程快速上手2》在PicoFermiBagels这个逻辑推理游戏中，你要根据线索猜出一个三位数。游戏会根据你的猜测给出以下提示之一：如果你猜对一位数字但数字位置不对，则会提示“Pico”；如果你同时猜对了一位数字及其位置，则会提示“Fermi”；如果你猜测的数字及其位置......
Python+Faker+Pandas数据库造数
今日分享一些Python常用的东西，整理一些小笔记，比如Faker的使用，panda的使用1、使用faker造数据简介测试工作中，经常会遇到需要制造大量测试数据的时候，如果手动造数据必然会浪费大量时间Faker是一个制造数据的强大的python库，可以制造姓名、电话、身份证、地址、邮箱等等各种各样伪......
Python中logging模块
在项目中我们常常需要打印日志，特别是在系统级项目上一般都会有自己日志模块，下面我们将介绍下Python中自带的logging模块(注意这是模块的名称并不是类)一、基本使用logging是一个包的名称，我们真正使用的是logging.Logger这个类。但是我们不能使用常规的方式进行初始化，......
python-transformers库
python-transformers库目录python-transformers库安装测试功能和优势Transformers术语模型与分词器加载预训练模型保存模型分词器编码和解码填充Padpipelinepipeline简介pipeline原理参考资料transformers是一个用于自然语言处理（NLP）任务，如文本分类、命名实体识别，机器翻译等，提供......
Python：Short Circuiting -- “OR”
ShortCircuitingOperatorChecksif:Evaluatesfromlefttorightupto:ExampleANDAllvaluesaretrueThefirstfalsevalueFalseand1/0evaluatestoFalseORAtleastonevalueistrueThefirsttruevalueTrueor1/0evaluatestoTrue......
python 数据库数据较验
#-*-coding:utf-8-*-#@Time:2023-09-07#@Author:Carl_DJ"""实现功能：1、python直接链接SqlServer数据库可以MySQL数据库，进行数据对比2、对比mysql和SqlServer两个数据库的表名以及表内数据的差异：3、对比的差异分别输出到文件中---->数据......

python实现zip分卷压缩与解压

1. python实现zip分卷压缩

`1.1 代码如下：`

1.2 缺点：

2.解压

相关文章

赞助商

阅读排行