硬盘上积累了太多的文件,主要是有很多图片重复了。
先来查重文件吧。
1 df=pd.DataFrame() 2 fps,hashcodes=[],[] 3 for parent,dirs,files in os.walk(os.getcwd()): 4 for file in files: 5 fp=os.path.join(parent,file) 6 with open(fp,'rb') as f: 7 a=f.read() 8 fps.append(fp) 9 hashcodes.append(hash(a)) 10 df=pd.DataFrame({'filepath':fps,'hashcode':hashcodes})
标签:查重,文件,hashcodes,fp,fps,os From: https://www.cnblogs.com/juanxia/p/17003850.html