首页 > 其他分享 >这个txt文档每章后面都有个这个特殊字符,如何提取出来删除掉?

这个txt文档每章后面都有个这个特殊字符,如何提取出来删除掉?

时间:2022-10-12 07:55:06浏览次数:46  
标签:每章 Python 代码 截图 filename re txt 特殊字符

大家好,我是Python进阶者。

一、前言

前几天在Python白银交流群【Python狗】问了一个Python正则表达式处理的问题,提问截图如下:

如果我是他的话,我会直接一步到位,使用notepad++打开文件,然后调出替换界面,全部替换即可,不需要代码实现也欧克的。不过这里使用Python的方式进行实现,一起来看看吧!

二、实现过程

这里【瑜亮老师】给了一份代码,如下所示:

import re
filename = '西游记全集(吴承恩).txt'
with open(filename, 'r', encoding='gbk') as f:
    data = f.read()

result = re.sub(r'\#.*?\#', '', data)

with open(filename, 'w', encoding='gbk') as f2:
    f2.write(result)

代码截图:

如果仅仅是粉丝截图发的那些需要替换的话,上面的代码是完全可以满足需求的,不过后来他又新增了一个新需求。

能不能把范围扩大点把最后的这个也匹配进去?答案在下面了。

加参数,匹配换行。使用re.S参数以后,正则表达式会将这个字符串作为一个整体,将\n当做一个普通的字符加入到这个字符串中,在整体中进行匹配。

三、总结

大家好,我是Python进阶者。这篇文章主要盘点了一个Python正则表达式处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【Python狗】提问,感谢【瑜亮老师】给出的思路和代码解析,感谢【dcpeng】等人参与学习交流。

标签:每章,Python,代码,截图,filename,re,txt,特殊字符
From: https://www.cnblogs.com/dcpeng/p/16783218.html

相关文章

  • shell 知识点补充(3)-修改语系/特殊字符/ printf/sed 工具/awk 工具/diff/cmp
    1、修改语系的方法为:[root@testroot]#LANG=en             (根据情况指定为其它语法,如:C)[root@testroot]#exportLANGlinuxvi删除指定所有字符按一下esc......
  • CMakeLists.txt中打印所有变量
    一、打印可见变量及其值get_cmake_property(_variableNamesVARIABLES)foreach(_variableName${_variableNames})message(STATUS"${_variableName}=${${_variabl......
  • facenet生成自己的pairs.txt
    #_*_coding:utf-8_*_importosimportrandomimportargparseimportsysclassGeneratePairs:"""Generatethepairs.txtfileforapplying"validat......
  • python将print的数据输出到txt文件中
    前言:在写一些小的测试脚本时,需要查看一些日志,我们不会去搭建一个logger工具;而是选择直接输出到txt文件中,测试完后,也方便查看结果。在需要输出打印前面,打开txt文件,以追加的......
  • [20221008]sql profile优化失效问题.txt
    [20221008]sqlprofile优化失效问题.txt--//生产系统一条sql语句存在性能问题,使用sqlprofile优化固定执行计划,再次出现问题,以前也遇到类似的问题,做一个记录.1.环境:SY......
  • Java中如何使用Scanner类读取.txt文件呢?
    转自:http://www.java265.com/JavaJingYan/202111/16359892761682.html 文件是日常开发中,使用最多的一种东西,在操作系统中,万物都以文件的形式存在,如:磁盘,网络,内存都都以......
  • robots.txt在SEO中作用
    robots.txt是什么robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是......
  • 我的CMakeLists.txt模板
    我的CMakeLists.txt模板,适用于windowsSDK风格的程序,不考虑测试和安装问题.rc资源文件部分,适用windows项目。#####################################################......
  • 【HTML】学习路径6-实体字符/特殊字符/转义字符
    &code;为什么有这个东西HTML中,某些字符是预留的,比如<>等,浏览器会把这些字符识别成标签。如果需要正确的在浏览器中展示这些字符,则需要使用实体字符(characterentitles),......
  • 使用Python实现读取TXT小说文件按每一回显示打印出来
    大家好,我是皮皮。一、前言前几天在Python铂金交流群【红色基因代代传】问了一个Python处理的问题,提问截图如下:文件里边的部分截图如下:大概的需求如下所示:二、实现过程这里【......