首页 > 其他分享 >利用正则表达式从字符串中提取浮点数

利用正则表达式从字符串中提取浮点数

时间:2024-09-05 14:26:01浏览次数:7  
标签:提取 正则表达式 浮点数 float 字符串 match

在 Python 中,使用正则表达式可以非常方便地从字符串中提取浮点数。Python 的 re 模块提供了正则表达式支持。下面是如何使用正则表达式提取浮点数的示例。

利用正则表达式从字符串中提取浮点数_正则表达式

1、问题背景

在开发过程中,有时候我们需要从字符串中提取浮点数,例如从 HTML 代码中提取价格信息。但是,浮点数的格式可能多种多样,例如带有逗号分隔符的数字或带有美元符号前缀的数字。因此,我们需要一种方法来处理各种格式的浮点数。

2、解决方案

我们可以使用正则表达式来提取浮点数。正则表达式是一种强大的文本处理工具,可以用于查找、替换和提取字符串中的信息。

以下是如何使用正则表达式从字符串中提取浮点数的示例:

import re

# 定义正则表达式模式
pattern = r"[-+]?\d+(?:\.\d*)?"

# 编译正则表达式模式
regex = re.compile(pattern)

# 从字符串中提取浮点数
string = "The price is $12.99"
match = regex.search(string)
if match:
    # 获取浮点数的值
    float_value = float(match.group())
    print(float_value)

输出:

12.99

在上面的示例中,正则表达式模式 r"[-+]?\d+(?:\.\d*)?" 匹配任何带有可选的正负号、整数部分和小数部分的数字。

re.search() 函数用于在字符串中搜索匹配正则表达式模式的子字符串。如果找到匹配项,则返回一个 Match 对象,否则返回 None

Match 对象的 group() 方法用于获取匹配项的值。

上面的示例只演示了如何从字符串中提取一个浮点数。如果字符串中有多个浮点数,则可以使用正则表达式 findall() 函数来提取所有匹配项。

以下是如何使用正则表达式 findall() 函数从字符串中提取所有浮点数的示例:

import re

# 定义正则表达式模式
pattern = r"[-+]?\d+(?:\.\d*)?"

# 编译正则表达式模式
regex = re.compile(pattern)

# 从字符串中提取所有浮点数
string = "The price is $12.99 and the tax is $2.99"
matches = regex.findall(string)
for match in matches:
    # 获取浮点数的值
    float_value = float(match)
    print(float_value)

输出:

12.99
2.99

在上面的示例中,正则表达式 findall() 函数返回一个包含所有匹配项值的列表。

我们还可以使用正则表达式来提取带有逗号分隔符的浮点数。以下是如何使用正则表达式从字符串中提取带有逗号分隔符的浮点数的示例:

import re

# 定义正则表达式模式
pattern = r"[-+]?(?:\d+(?:\.\d*)?|\.\d+),(?:\d+(?:\.\d*)?|\.\d+)"

# 编译正则表达式模式
regex = re.compile(pattern)

# 从字符串中提取带有逗号分隔符的浮点数
string = "The price is 12,999.99"
match = regex.search(string)
if match:
    # 获取浮点数的值
    float_value = float(match.group().replace(",", ""))
    print(float_value)

输出:

12999.99

在上面的示例中,正则表达式模式 r"[-+]?(?:\d+(?:\.\d*)?|\.\d+),(?:\d+(?:\.\d*)?|\.\d+)" 匹配任何带有可选的正负号、整数部分和小数部分的数字,并允许逗号分隔符。

我们还可以使用正则表达式来提取带有美元符号前缀的浮点数。以下是如何使用正则表达式从字符串中提取带有美元符号前缀的浮点数的示例:

import re

# 定义正则表达式模式
pattern = r"\$[+-]?(?:\d+(?:\.\d*)?|\.\d+)"

# 编译正则表达式模式
regex = re.compile(pattern)

# 从字符串中提取带有美元符号前缀的浮点数
string = "The price is $12.99"
match = regex.search(string)
if match:
    # 获取浮点数的值
    float_value = float(match.group().replace("$", ""))
    print(float_value)

输出:

12.99

在上面的示例中,正则表达式模式 r"\$[+-]?(?:\d+(?:\.\d*)?|\.\d+)" 匹配任何带有美元符号前缀的数字,并允许可选的正负号、整数部分和小数部分。

这个正则表达式可以识别包括正数、负数和小数的浮点数。我们可以根据需要调整正则表达式,以适应更多的浮点数格式,例如科学计数法或无小数点的整数等。

标签:提取,正则表达式,浮点数,float,字符串,match
From: https://blog.51cto.com/u_13488918/11927834

相关文章

  • base64是什么,在 C# 中对 Base64 字符串进行编码和解码
    原文链接:https://blog.csdn.net/ty_oldman/article/details/116306785         https://blog.csdn.net/qq_55752792/article/details/139681358base64是什么Base64编码,是由64个字符组成编码集:26个大写字母AZ,26个小写字母az,10个数字0~9,符号“+”与符号“/”。Bas......
  • 字符函数和字符串函数
    在编程的过程中,我们经常要处理字符和字符串,为了方便操作字符和字符串,C语言标准库中提供了⼀系列库函数,接下来我们就学习⼀下这些函数。目录1.1字符分类函数1.2字符转换函数例子:代码结果2.strlen3.strcpy4.strcat5.strcmp6.strstr7.strtok8.strerror9.模拟实现9.1str......
  • STM32 VCP串口通信 浮点数printf打印的问题 保姆级教程
    各位,我最近用STM32G474,设计一个电机驱动的电路。其中ADC采样供电电压,结果是个浮点数,想用printf打印出来看看。然而,电脑上都是USB的接口,没有串口,不想接USB转串口的芯片的话,就将STM32的USB直接配置成VCP(virtualCommunicationPort),那么,电脑就直接将USB识别为串口,直接用printf......
  • base64和字符串的转换
    base64转换为字符串/***base64转字符串*@parambase64*@return*/publicstaticStringbase64ToStr(Stringbase64){if(StringUtils.isBlank(base64)){returnStringUtils.EMPTY;}byte[]bytes......
  • 代码随想录算法训练营|Day07 LeetCode 344.反转字符串 ,541.反转字符串||,卡玛网54.替换
    344.反转字符串344.反转字符串-力扣(LeetCode)classSolution{public:voidreverseString(vector<char>&s){intlens=s.size();intright,left;if(lens%2!=0)//奇数个{right=lens/2+1;left=l......
  • 20240904:字符串选做
    P4555[国家集训队]最长双回文串题意:给定字符串\(s\),找到他最长双回文串\(t\)的长度。双回文串定义为存在一个\(i>1\)使得\(t[1,i)\)和\(t[i,n]\)都是回文串。\(\verts\vert\le10^5\)。二分哈希求出所有回文中心的半径,设以\(i\)为中心的最长回文串为\([l_i,......
  • 20240907_051745 python 正则表达式 常见元字符
    •.:匹配任意单个字符•\d:匹配数字(等价于[0-9])•\w:匹配字母、数字、下划线(等价于[a-zA-Z0-9_])•\s:匹配空格、制表符、换行符等空白字符•^:匹配开头•$:匹配结尾•*:匹配前面的字符零次或多次•+:匹配前面的字符一次或多次•?:匹配前面的字符零次或一次•[]:匹配方括......
  • 20240907_061745 python 正则表达式 re.match方法
    情况一从头匹配匹配成功的数据可以通过匹配的对象的group()方法获取关注一下匹配不成功的情况情况二从中间匹配......
  • 正则表达式
    什么是正则表达式:正则表达式就是为处理大量的字符串及文本而定义的一套规则和方法。正则表达式就是把人类想要查询的东西,用计算机能识别的语言表达出来的一种规则。正则表达式仅受三剑客(grep,sed,awk)命令支持,其他命无法使用        ^ //以什么开头;"^......
  • 日志打印的时候使用占位符而不是用字符串拼接
    日志打印的时候使用占位符而不是用字符串拼接1.logger.info("错误信息:"+e.getMessage());  //字符串拼接2.logger.info("错误信息:{}"+e.getMessage()); //使用占位符(正确使用方式)因为String字符串的拼接会使用StringBuilder的append()方式,有一定的性能损耗。......