首页 > 编程问答 >仅使用正则表达式替换特定字符之间的空格

仅使用正则表达式替换特定字符之间的空格

时间:2024-07-30 08:58:38浏览次数:17  
标签:python regex

我正在尝试使用正则表达式替换 markdown 文档中包含的乳胶中的空格。 \\; 在我使用的 md 包中,所有乳胶都包裹在
$ I 中想要将以下内容从 $$

更改为

"dont edit this $result= \frac{1}{4}$ dont edit this $$some result=123$$"

我已经设法使用下面的混乱函数来完成此操作,但想使用正则表达式来获得更清晰的方法。任何帮助将不胜感激

"dont edit this $result=\\;\frac{1}{4}$ dont edit this $$some\\;result=123$$"

输出:

import re
vals = r"dont edit this $result= \frac{1}{4}$ dont edit this $$some result=123$$"
def cleanlatex(vals):
    vals = vals.replace(" ", "  ")
    char1 = r"\$\$"
    char2 = r"\$"
    indices = [i.start() for i in re.finditer(char1, vals)]
    indices += [i.start() for i in re.finditer(char2, vals.replace("$$","~~"))]

    indices.sort()
    print(indices)
    # check that no of $ or $$ are even
    if len(indices) % 2 == 0:
        while indices:
            start = indices.pop(0)
            finish = indices.pop(0)
            vals = vals[:start] + vals[start:finish].replace('  ', '\;') + vals[finish:]
    
    vals = vals.replace("  ", " ")
    return vals

print(cleanlatex(vals))

Output:

[18, 39, 60, 78]   
dont edit this $result=\\;\frac{1}{4}$ dont edit this $$some\\;result=123$$

可以使用以下正则表达式替换乳胶分隔符之间的空格:

import re

vals = r"dont edit this $result= \frac{1}{4}$ dont edit this $$some result=123$$"
result = re.sub(r'(\$\$)(.*?)(\$\$)', lambda m: m.group(1) + m.group(2).replace(' ', r'\;') + m.group(3), vals)
result = re.sub(r'(\$)(.*?)(\$)', lambda m: m.group(1) + m.group(2).replace(' ', r'\;') + m.group(3), result)
print(result)

解释:

  1. re.sub(r'(\$\$)(.*?)(\$\$)', lambda m: m.group(1) + m.group(2).replace(' ', r'\;') + m.group(3), vals) : 这个正则表达式匹配 $$ 包裹的乳胶代码块。
  2. (\$\$) :匹配两个 $ 并将其捕获到组 1 中。
  3. (.*?) :非贪婪地匹配任何字符,并将其捕获到组 2 中。
  4. (\$\$) :匹配两个 $ 并将其捕获到组 3 中。
  5. lambda m: m.group(1) + m.group(2).replace(' ', r'\;') + m.group(3) :这个 lambda 函数将匹配到的字符串替换为组 1、组 2(其中空格被替换为 \; )和组 3 的拼接。

  6. re.sub(r'(\$)(.*?)(\$)', lambda m: m.group(1) + m.group(2).replace(' ', r'\;') + m.group(3), result) : 这个正则表达式与第一个表达式类似,但是匹配的是 $ 包裹的乳胶代码块。

这个代码会将 vals 字符串中所有乳胶分隔符之间的空格替换为 \; ,并将结果存储在 result 变量中。

标签:python,regex
From: 73397546

相关文章

  • 基于Python网络招聘数据可视化分析系统的设计与实现
    基于Python网络招聘数据可视化分析系统的设计与实现DesignandImplementationofPython-basedNetworkRecruitmentDataVisualizationAnalysisSystem完整下载链接:基于Python网络招聘数据可视化分析系统的设计与实现文章目录基于Python网络招聘数据可视化分析系......
  • 即使使用 docker run -dit 命令,python-Docker 容器也会在运行两秒后退出
    我想从此处使用Dockerfile测试自定义kubernetes调度程序:FROMpython:3.7RUNpipinstallkubernetesCOPYscheduler.py/scheduler.pyCMDpython/scheduler.py一旦创建了映像和容器:dockerbuild-tapp.dockercontainerrun-d-it--namemy-sched......
  • Python多重处理,如何避免创建具有百万个对象的元组
    python多处理新手。我有一项任务,涉及访问网络服务数百万次并将响应保存在文件中(每个请求都有单独的文件)。我已经得到了高级工作代码,但对一些事情没有感到困惑。以下两种语法有什么区别?pool=Pool(processes=4)pool.starmap(task,listOfInputParametersTu......
  • Python OpenCV - 显示坏像素检查测试
    我想找到显示器中存在的每个坏像素。坏像素可能是颜色不正确的像素,或者像素只是黑色。显示屏的尺寸为160x320像素。所以如果显示效果好的话,必须有160*320=51200像素。如果显示器没有51200像素,那就是坏的。另外,我想知道每个坏像素的位置。一旦拍摄的图像太大,我将共享一个......
  • 在python日志输出的每一行前面添加变量缩进
    我正在将日志记录构建到一个Python应用程序中,我希望它是人类可读的。目前,调试日志记录了调用的每个函数以及参数和返回值。这意味着,实际上,嵌套函数调用的调试日志可能如下所示:2024-07-2916:52:26,641:DEBUG:MainController.initialize_componentscalledwithargs<control......
  • 使用 DQN 实现 pong,使用 python 中的特征向量而不是像素。我的 DQNA 实现代码正确吗,因
    我正在致力于使用OpenAI的Gym为Pong游戏实现强化学习(RL)环境。目标是训练人工智能代理通过控制球拍来打乒乓球。代理收到太多负面奖励,即使它看起来移动正确。具体来说,奖励函数会惩罚远离球的智能体,但这种情况发生得太频繁,即使球朝球拍移动时似乎也会发生。观察......
  • Python CDLL 无法加载两次
    我正在尝试用python创建一个密码管理器,但遇到了一个问题,一旦加载了一种类型的dll,我就无法加载不同的dll,在这个示例中,我加载了一个dll,并尝试解密加密的密码数据,它工作正常,直到我加载另一个不同的nss3.dll文件,此时它给我一个错误:“过程入口点HeapAlloc无法位于动态链......
  • 你能将 HTTPS 功能添加到 python Flask Web 服务器吗?
    我正在尝试构建一个Web界面来模拟网络设备上的静态接口,该网络设备使用摘要式身份验证和HTTPS。我想出了如何将摘要式身份验证集成到Web服务器中,但我似乎无法找到如何使用FLASK获取https,如果您可以向我展示如何实现,请评论我需要使用下面的代码做什么来实现这一点。from......
  • Python:比较 csv 文件并打印相似之处
    我需要比较两个csv文件并打印出它们的相似之处。第一个文件有名称和浓度,第二个文件就像只有名称的“最佳”列表,我需要绘制相似性图表。例如,这就是我的列表的样子:file1-old_file.csvname_id,conc_test1,conc_test2name1,####,####name2,###......
  • Python 类交叉引用
    我用Python创建了一个数独游戏。我有一个:单元格类-“保存”数字可能性单元格组-保存单元格类实例我使用这些组在数独中运行行、列和正方形功能。每个单元格包含所有组,他属于classCell:def__init__(groups):self.groups=groupscla......