首页 > 编程语言 >软件测试|使用Python提取出语句中的人名

软件测试|使用Python提取出语句中的人名

时间:2023-11-15 16:32:09浏览次数:46  
标签:人名 spaCy 提取 spacy Python 文本 软件测试

软件测试|使用Python提取出语句中的人名_Python

简介

在自然语言处理(NLP)中,提取文本中的人名是一项常见的任务。Python作为一种流行的编程语言,拥有强大的NLP库和工具,使我们能够轻松地进行这项任务。在本文中,我们将使用Python示例来演示如何提取文本中的人名。

环境准备

我们将使用以下Python库来执行人名提取任务:

  • spaCy:一个流行的NLP库,它提供了命名实体识别(NER)功能,可以帮助我们识别文本中的人名。
  • re:Python的正则表达式库,用于进行文本模式匹配。

re是Python自带的库,所以我们不需要额外进行安装,但是spaCy是第三方库,需要我们安装,安装命令如下:

pip install spacy

注:当我们安装spaCy库之后,还需要安装其语言模型,安装命令如下:

# 英文模型
python -m spacy download en_core_web_sm
# 中文模型
python -m spacy download zh_core_web_sm

示例代码

下面是一个Python示例,演示如何使用spaCy库来提取文本中的人名:

import spacy

# 加载spaCy的英文模型
nlp = spacy.load("zh_core_web_sm")

# 输入文本
text = "欢迎大家参加本次活动。张三、李四和王五将会发表演讲。"

# 使用spaCy处理文本
doc = nlp(text)

# 提取人名
people_names = []
for ent in doc.ents:
    if ent.label_ == "PERSON":
        people_names.append(ent.text)

# 打印提取到的人名
for name in people_names:
    print(name)

在上面的示例中,我们首先加载了spaCy的英文模型,并指定了文本。然后,我们使用spaCy对文本进行处理,识别其中的命名实体。最后,我们筛选出标记为"PERSON"(人名)的实体,并将它们存储在people_names列表中。

运行代码,输出结果如下:

张三
李四
王五

总结

spaCy是一个高性能、易于使用的自然语言处理库,可以处理多种语言,提供了许多预训练模型和可扩展功能。本文主要介绍了提取人名的功能,后续我们还将介绍spaCy的其他强大功能。

标签:人名,spaCy,提取,spacy,Python,文本,软件测试
From: https://blog.51cto.com/u_15640304/8398558

相关文章

  • 在python开发过程中常见的异常错误
    下面这些也是常见的异常错误,在报错的时候不要害怕,记住这些常见的单词。AttributeError尝试访问未知的对象属性EOFError用户输入文件末尾标志EOF(Ctrl+d)FloatingPointError浮点计算错误GeneratorExitgenerator.close()方法被调用的时候ImportError导入模块失败的时候KeyboardInte......
  • 为什么要学习python技术??
    大家好,随着大数据时代的到来,相信大家对新时代的认知达到了一个新的高度,我们可以仔细观察我们的生活,似乎每一年都会发生较大的变化。我记得我刚上大学的时候,移动支付才刚开始普及,短短几年,出门只需要一部手机便能行走天下,其中计算机编程起到了重要作用。 我们为什么要学习编......
  • Python3
    importnumpyasnpx=np.array([1.0,2.0,3.0,4.0])y=x+2Ans:array([3.,4.,5.,6.])y=x>2.0Ans:array([False,False,True,True]) A.SyntaxError-alsoknownasparsingerror.Pythondoesnotlikeyourstructure.ItislikeDrFasks......
  • mojo编程语言:编译后的mojo二进制执行文件调用python库报错——设置MOJO_PYTHON_LIBRAR
    代码:frompythonimportPythonfnf()raises:#ThisisequivalenttoPython's`importnumpyasnp`letnp=Python.import_module("numpy")leta=np.array([1,2,3])print(a)fnmain()raises:f() mojo编译后执行,报错:Mojo/Pyth......
  • mojo编程语言:mojo调用python库及内置函数builtins
    编程语言mojo调用python十分方便,mojo不仅可以调用python的库函数更可以调用python的内置函数(builtins),给出示例代码:frompythonimportPythonfnmain()raises:Python.add_to_path(".")letmypython=Python.import_module("xyz")letx=mypython.hello()......
  • 【Python_Django】Django_高级的Python Web框架的基本使用
    Django是一个高级的PythonWeb框架,可以快速开发安全和可维护的网站。由经验丰富的开发者构建,Django负责处理网站开发中麻烦的部分,可以专注于编写应用程序,而无需重新开发准备环境win64系统python3.9Django4.2.6pycharm2021.2.1 创建Django项目1、新......
  • 解决Python requests库不支持发送可迭代对象的问题
    在加班的路上,bug是那永远的陪伴。对于程序员来说,bug就像黑暗中的萤火虫,虽然微弱却永远指引着前进的方向。今天,我们要探讨的是Pythonrequests库在处理可迭代对象时遇到的问题,这是一道让许多开发者头痛的难题。本文将详细介绍一种临时解决方案,希望能帮助大家解决问题,让编程之路更加......
  • 盘点一个使用Python自动化处理GPS、北斗经纬度数据实战(下篇)
    大家好,我是皮皮。一、前言上一篇文章我们使用了Python来实现数据的导入和分列处理,最终可以得到符合预期的结果,不过还可以继续深挖优化下,这一篇文章一起来看看吧。优化的背景如下图所示:二、实现过程这里【瑜亮老师】继续给了一个优化指导,如下图所示:并且给出的代码如下:withopen("./G......
  • 云计算-使用python发送日志易告警
    现状公司有使用日志易,对应用层监控,并实现了大屏告警。同时也能够查询到相关的日志记录相关的日志易查询语句如下:#总量logtype:NginxANDNginx.url:\/$SubMenuName$*ANDNOT`JS_CSS_JPG_FONT`|statscount()asTotalCount#错误数(大于500)logtype:NginxANDNginx.url:\/$Su......
  • Python+PlayWright+ Pytest + Allure 自动化学习路线
    前言对于自己写过文章的总结,并不代表最好的学习路线还未完结,努力更新中ing建议把每节的实战演练做一下 PlayWrightPlayWright-环境安装PlayWright-如何使用playwrighPlayWrigh-同步和异步运行PlayWright-深入异步PlayWright-元素定位PlayWright-文本输......