首页 > 编程语言 >python 利用md5去重 转载

python 利用md5去重 转载

时间:2022-10-03 21:25:40浏览次数:57  
标签:__ python tlie base print 转载 filecount md5

原文连接:https://blog.csdn.net/babytiger/article/details/90293866

# /usr/bin/env python
# -*- coding:utf-8 -*-
# 运行的代码文件要放到删除重复的文件或图片所包含的目录中
import os
import hashlib

base = ("D:\\working\\Python\\readHeadFileTraining\\soldierDetection\\data\\download")  # 这里就是你要清缴的文件们了

def filecount():

    filecount = int(os.popen('dir '+base+'/B |find /V /C ""').read())
    return (filecount)


def md5sum(filename):
    f = open(filename, 'rb')
    md5 = hashlib.md5()
    fb = f.read()
    md5.update(str(fb).encode('utf-8'))
    f.close()
    return (md5.hexdigest())


def delfile():
    all_md5 = {}

    filedir = os.walk(base)
    deletefileID=1
    for i in filedir:
        for tlie in i[2]:
            if md5sum(base+'\\'+ tlie) in all_md5.values():
                os.remove(base+'\\'+tlie)
                print(deletefileID,'will delete '+base+'\\'+tlie)
                deletefileID=deletefileID+1
            else:
                all_md5[tlie] = md5sum(base+'\\'+ tlie)


if __name__ == '__main__':
    oldf = filecount()
    print('去重前有', oldf, '个文件\n\n\n请稍等正在删除重复文件...')
    delfile()
    print('\n\n去重后剩', filecount(), '个文件')
    print('\n\n一共删除了', oldf - filecount(), '个文件\n\n')

 

标签:__,python,tlie,base,print,转载,filecount,md5
From: https://www.cnblogs.com/xianzhewujie/p/16751286.html

相关文章

  • python中getter和setter方法的使用
    classUserInfo(object):@propertydefusername(self):#这里返回的self.名字不能和函数名同名[email protected](self,usern......
  • Python语法之集合
    集合是无序元素的集合,集合中的元素不可重复,并且创建完成后,其中的元素不可更改。但是整个集合是可以更改的,我们可以向其增加元素,也可以从中删除元素。也就是说,我们无法修改......
  • Python SQLite3 基本操作类
    #!/usr/bin/envpython#encoding:utf-8"""@version:v1.0@author:W_H_J@license:ApacheLicence@contact:[email protected]@software:PyCharm@f......
  • python类型注解
    python类型注解functionannotation写法:使用冒号:加类型代表参数类型默认值参数示例:b:int=2使用->加类型代表返回值类型python解释器运行时并不会检查类型......
  • 使用Python实现读取TXT小说文件按每一回显示打印出来
    大家好,我是皮皮。一、前言前几天在Python铂金交流群【红色基因代代传】问了一个Python处理的问题,提问截图如下:文件里边的部分截图如下:大概的需求如下所示:二、实现过程这里【......
  • 盘点一个Python抓取有道翻译爬虫中的报错问题
    大家好,我是皮皮。一、前言前几天在Python白银交流群【斌】问了一个Python网络爬虫的问题,提问截图如下:报错截图如下:粉丝需要的数据如下:二、实现过程有道翻译之前有做过很多,确......
  • 将你的 Python 脚本转换为命令行程序
    使用Python中的​​scaffold​​​和​​click​​库,你可以将一个简单的实用程序升级为一个成熟的命令行界面工具。在我的职业生涯中,我写过、用过和看到过很多随意的......
  • 常见工程、应用、学习错误及安装问题之Python
    ​​pip临时使用国内镜像源​​​​python创建文件夹​​​​python读取文件下所有文件路径​​​​将numpy中的True/False转换成1/0​​​​使用python复制文件​​​​L......
  • 为python安装扩展模块时报错——error: invalid command 'bdist_wheel'
    具体过程: devil@hp:~/lab$./bazel-bin/python/pip_package/build_pip_package/tmp/dmlab_pkg2022年10月03日星期一14:05:54CST:===Buildingwheelusage:setu......
  • python pygame 迷宫生成
    importrandomimportsysimportpygame#使用pygame之前必须初始化pygame.init()#参数设置box_w,box_h=5,5#盒子宽高window_w,window_h=400,400x,y=0,0#盒......