首页 > 其他分享 >R : 使用正则表达式提取属水平的名称

R : 使用正则表达式提取属水平的名称

时间:2023-10-23 15:37:39浏览次数:29  
标签:__ Hydrogenophaga 提取 正则表达式 microbial 名称

setwd("C:\\Users\\Administrator\\Desktop")
# 读取txt文件
microbial_names <- readLines("your_input_file.txt")

# 使用正则表达式提取属水平的名称
genus_names <- sapply(microbial_names, function(name) {
  matches <- regmatches(name, regexpr("(?<=g__).*$", name, perl = TRUE))
  return(matches[1])
})

# 将结果写入新的txt文件
writeLines(genus_names, "output_genus_names.txt")

如,“k__Bacteria.p__Proteobacteria.c__Betaproteobacteria.o__Burkholderiales.f__Comamonadaceae.g__Hydrogenophaga”只保留“Hydrogenophaga”

标签:__,Hydrogenophaga,提取,正则表达式,microbial,名称
From: https://www.cnblogs.com/wzbzk/p/17782569.html

相关文章

  • CSS (三) 常用类名名称
    1.网页设计中常用的CSS命名规则:<divclass="header"></div>头:header内容:content/container尾:footer导航:nav侧栏:sidebar栏目:column页面外围控制整体布局宽度:wrapper左右中:leftrightcenter登录条:loginbar标志:logo广告:banner页面主体:main热点:hot新闻:news下载:download子导航:subnav菜......
  • 小白学Python - 使用 Python 的 OpenCV 绘制矩形并提取对象
    使用Python的OpenCV绘制矩形并提取对象OpenCV是一个开源计算机视觉和机器学习软件库。可以在它的帮助下完成各种图像处理操作,例如操纵图像和应用大量滤镜。它广泛用于对象检测、人脸检测和其他图像处理任务。让我们看看如何使用OpenCV在图像上绘制矩形并提取对象。编写代码#......
  • 程序语言基础之正则表达式的字符偶数个配置
    例题展示例题解决其中,*指的是将他前面的字符重复0次或者若干次;例如:b*可以为b,也可以为bb,bbb等;......
  • 无涯教程-AWK - 正则表达式运算符函数
    本示例说明了正则表达式运算符的两种形式。Match它表示为〜,它查找包含匹配字符串的字段,如,以下示例将打印包含模式9的行。[Learnfk]$awk'$0~9'marks.txt在执行此代码时,您将获得以下输出-2)ToolfkMaths905)NesfkHistory89不匹配它表示为!〜,它查找不包......
  • 文件名称批量修改
    题目:批量修改文件名是工作中一个常见的需求,本节实践实现的功能是将test文件夹下的所有文件重命名为“rename_原文件名”,例如,将hello.txt重命名为rename_hello.txt?实现步骤:1、首先在数据集中把文件下载下来导入至test文件夹下:这是数据集的下载地址;https://aistudio.baidu......
  • 正则表达式
    正则表达式在线测试工具地址:https://www.regextester.com/https://regex101.com/......
  • 修改主机名称
    永久修改主机名称:修改语法:hostnamectlset-hostname新的主机名称查看语法:localhost[root@192~]#hostnamectlset-hostname新的主机名称[root@192~]#hostname 重新关掉窗口启动即可 ......
  • 如何写正则表达式
    正则表达式是一种用来匹配字符串的规则。每个字符在正则表达式中都有其特定的含义,下面是一些常见的字符及其含义: 1.^:匹配字符串的开头位置。2.$:匹配字符串的结尾位置。3..:匹配任意单个字符。4.*:匹配0个或多个前面的字符。5.+:匹配1个或多个前面的字符。6.?:匹配......
  • 招商银行pdf流水提取分析工具
    已开源在GitHub,https://github.com/youzhiran/financial_analysis招商银行pdf流水提取分析工具✨使用方法直接启动选择pdf文件即可⚙️设置项说明配置项说明save_path导出文件的存储目录,可以写绝对路径或相对路径areapdf边距定义,[top,left,bottom,right],......
  • STATA 正则表达式应用
    ​​1、匹配函数:regexm()和ustrregexm()(1)regexm(s,re)函数第一个参数s表示字符串,第二个参数re代表正则表达式,如果正则表达式匹配到字符串s中的某个子字符串,则函数regexm(s,re)的返回值为1,否则为0。但是值得注意的是,由于regexm()是早期版本的正则表达式函数,所以不能识别元字符......