re.sub()
函数是Python中re
模块提供的用于替换字符串中的匹配项的功能。它的主要作用是在给定的输入字符串中查找符合正则表达式模式的文本,并将其替换为指定的新文本。
re.sub()
函数的基本语法如下:
re.sub(pattern, repl, string, count=0, flags=0)
pattern
:要搜索的正则表达式模式。repl
:替换的字符串,也可以是一个函数。string
:要在其中进行替换的输入字符串。count
:可选参数,指定替换的最大次数。默认为0,表示替换所有匹配项。flags
:可选参数,用于指定正则表达式的标志。
以下是一个使用re.sub()
函数的示例:
import re
# 输入字符串
input_string = "Hello, my email is john@example.com and my friend's email is alice@example.com"
# 使用正则表达式替换电子邮件地址
pattern = r'\b[\w.-]+@[\w.-]+\.\w+\b' # 正则表达式模式匹配电子邮件地址
replacement = "[Email Removed]" # 替换为此文本
result_string = re.sub(pattern, replacement, input_string)
print(result_string)
在上面的示例中,我们使用正则表达式模式 r'\b[\w.-]+@[\w.-]+\.\w+\b'
来匹配电子邮件地址,然后使用 [Email Removed]
替换它们。re.sub()
函数会在输入字符串中查找并替换所有匹配的电子邮件地址,最后输出替换后的字符串。
输出将是:Hello, my email is [Email Removed] and my friend's email is [Email Removed]
这个示例演示了如何使用re.sub()
函数来执行字符串中的替换操作,通过提供正则表达式模式和替换文本,您可以轻松地处理文本数据。