首页 > 编程语言 >Python批量改文件名

Python批量改文件名

时间:2023-01-28 22:55:35浏览次数:49  
标签:匹配 批量 文件名 Python filename re print os

对以下路径中的文件名批量修改。

一、读取指定路径中的文件名

#导入标准库
import os

#读取文件名
filesDir = "路径……"
fileNameList = os.listdir(filesDir)

#输出路径中的所有文件
for filename in fileNameList:
    print(filename)

二、正则表达式提取需要保留的部分

1、介绍re库

这里需要导入re库,re库主要是Python的标准库,主要用于字符串匹配。

Re库主要函数
函数名称 作用 返回类型
re.findall() 搜索并返回所有能匹配到的子串 列表类型
re.match() 从字符串的开头进行匹配 match对象
re.search() 搜索匹配到的第一个位置 match对象
re.split() 将字符串按匹配结果进行分割 列表类型
re.finditer() 搜索返回匹配结果的迭代类型 match对象
re.sub() 在字符串中替换所有匹配正则表达式的子串 ,返回替换后的字符串 字符串

2、re库中函数的用法

(1)re.findall() #最常用

第一个参数为匹配的正则表达式,第二个参数为要搜索的字符串。

import re

#搜索所有的五位数字
ls = re.findall(r'[1-9]\d{5}','BIT100081  TUS444567')
print(ls)


['100081', '444567']
(2)re.sub(pattern,repl,string,count)
参数 作用
pattern 正则表达式
repl 替换匹配字符串的字符串
string 匹配字符串
count 最大替换次数

re库的具体用法,读者自己探索,由于字符串的复杂程度不同,正则表达式的用法不同。详情可以仔细研究官网或者菜鸟教程:Python3 正则表达式

3、例子说明

  • 以本例子说明,这几个文件名的相同部分,都有括号,所以先写匹配括号的正则表达式。

  • re库中compile方法可以返回一个正则表达式的截取规则。其中(.*?)表示任意字符出现任意次。

# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)
  • 这样就把括号以及括号中的内容删除掉了。
  • 要记住compile里传进去的一定是一个字符串,前面 r 是防止转义字符。测试一下是否匹配,避免出现错误。
# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)

#开始数组循环更改文件名
for filename in fileNameList:
    print("旧的名字是:\t"+filename)
    print("开始截取!")
    newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
    print("新名字是:\t"+newFilename)
    print("\n\n")

三、正式更改文件名

1、用 os库里的rename方法

os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))

2、测试是否正确

注: 不同的文件名,有不同的使用正则表达式的方式,还是具体问题具体分析。

#开始数组循环更改文件名
for filename in fileNameList:
    print("旧的名字是:\t"+filename)
    print("开始截取!")
    newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
    print("新名字是:\t"+newFilename)
    print("开始改名。。。")
    os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))
    print("改名完毕!")
    print("======================================================================================")

3、其他的匹配情况

(1)匹配文件名序号
#删除重复的文件名序号
rules = re.compile(r'^\d', re.S)
  • 如果文件名有两个序号,并且重复,即可使用此功能,像此案例就不可以使用,因为两个序号不相同。

  • 如果文件不超过0-9,运行一次即可;但是超过10-99,可以在运行一次;如果序号为三位,可以运行第三次。

  • \d 等价于 [0-9]

(2)匹配特殊字符
#删除文件名前的特殊字符,如果是"."删除".",如果是"#"删除"#"
rules = re.compile(r'^\.', re.S)
  • 注:匹配的时候要注意,这个特殊符号所在的位置;如果在开头,要按添加 ^ 符号;如果在其他位置,则要注意,如果删除的是点 . ,后缀名中的点也要注意。这时就要一开始删除后缀名,在完成更改时再添加上指定的后缀名。
(3)删除字符串中的指定的部分
# 正则表达式删除指定的的部分
rules = re.compile(r'Swagger-[0-9][0-9]:', re.S)
  • 注:正则表达式里指定的部分,建议复制粘贴,避免中间空格。
(4)最后一步添加后缀名
# 可以为文件名添加后缀,,,本质为在最后匹配的字符串最后增加一个部分,可以为数字,也可以为文件后缀
newFilename = newFilename + ".mp4"

四、完整代码

import os
import re


#读取文件名
filesDir = "E:/学习整理/14 Video/30 万物皆可运维"
fileNameList = os.listdir(filesDir)

#输出路径中的所有文件
for filename in fileNameList:
    print(filename)

# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)

# 正则表达式删除指定的的部分
# rules = re.compile(r'Swagger-[0-9][0-9]:', re.S)

#删除重复的文件名序号
# rules = re.compile(r'^\d', re.S)

#删除文件名前的特殊字符,如果是"."删除".",如果是"#"删除"#"
# rules = re.compile(r'^\.', re.S)

#开始数组循环更改文件名
for filename in fileNameList:
    print("旧的名字是:\t"+filename)
    print("开始截取!")
    newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
    print("新名字是:\t"+newFilename)
    print("开始改名。。。")
# 可以为文件名添加后缀,,,本质为在最后匹配的字符串最后增加一个部分,可以为数字,也可以为文件后缀
    # newFilename = newFilename + ".mp4"
    os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))
    print("改名完毕!")
    print("======================================================================================")

标签:匹配,批量,文件名,Python,filename,re,print,os
From: https://www.cnblogs.com/xiaobai-cs/p/17071451.html

相关文章

  • python-Couldn‘t find a tree builder with the features you requested: lxml
    执行BeautifulSoup(content,features='lxml')时报错,按照网上的方法安装lxml、重新安装lxml、安装指定版本lxml,都无效。最后发现只是PyCharm设置中project的pyth......
  • Python语言基础—常用运算符总结
    系列文章目录......
  • 2021年最新Python讲义:面向对象(OOP)基本概念
    面向对象(OOP)基本概念面向对象编程——​​ObjectOrientedProgramming​​​简写​​OOP​​目标了解面向对象基本概念01.面向对象基本概念我们之前学习的编程方......
  • 终于把Python库全部整理出来了,非常全面!
    Python库汇总篇!建议先马后看~文章目录​​前言​​​​学习爬虫需要掌握哪些库呢?​​​​通用​​​​网络爬虫框架​​​​HTML/XML解析器​​​​浏览器自动化与仿真​​......
  • Python 中的模块
    Python模块是一个Python文件,定义了各种功能接口。把复杂的功能封装为模块(又称为库),将功能实现的细节隐藏起来,使用该模块(库)的程序员不需要了解实现的细节。通过调用模块封......
  • Python基础——第一部分
    x进制类型定义\(0b****\):用二进制定义整型\(0o****\):用八进制定义整型\(0x****\):用十六进制定义整型a=0b1111b=15c=0o17d=0x0F输出:转换\(bin()\):......
  • 在 Python 中将一个 Legendre 系列添加到另一个 Legendre 系列
    要将一个Legendre系列添加到另一个系列,请使用Python中的polynomial.legendre.legadd()方法嘟嘟。该方法返回一个数组,表示其总和的勒让德系列。返回两个勒让德系列c1+......
  • 为什么你应该使用NumPy数组而不是嵌套的Python列表?
    在本文中,我们将向您展示为什么使用NumPy数组而不是嵌套的Python列表,以及它们之间的异同。PythonNumPyLibraryNumPy是一个Python库,旨在有效地处理Python中的数组。它快......
  • Python更适合某些编程需求吗?
    在本文中,我们将讨论Python是否更适合某些编程需求?比如竞争性编码。答案是肯定的;Python更适合编码。它在短时间内用更少的行数编写代码。基于产品的公司需要优秀的编码人......
  • #Python 数据查询功能,对标V-LOOKUP
    日常办公中,我们经常会遇到需要匹配表,匹配对应数据的场景,在EXCEL中,我们习惯使用VLOOKUP函数或者是X-LOOKUP函数,今天学习的是Python,pandas库中的匹配功能。首先导入所需的pa......