首页 > 编程语言 >python实现根据序列ID从fasta文件中删除指定的序列

python实现根据序列ID从fasta文件中删除指定的序列

时间:2023-10-14 10:23:18浏览次数:31  
标签:test1 python pc1 list ## 序列 rm fasta root

 

001、

[root@pc1 test1]# ls
a.fa  rm.list  test.py
[root@pc1 test1]# cat a.fa                  ## 测试fasta
>chr1
tttcccggg
>chr2
tttgggjjj
cccjjjjjj
>chr3
ccc
>chr4
aaaaatt
[root@pc1 test1]# cat rm.list                ## 删除列表
chr2
chr4
[root@pc1 test1]# cat test.py                ## 删除程序
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

rm_list = []
with open("rm.list", "r") as in_put1:
        for i in in_put1.readlines():
                rm_list.append(i.strip("\n"))
        in_put1.close()

with open("a.fa", "r") as in_put2:
        for i in in_put2:
                if i[0] == ">":
                        for j in rm_list:
                                if j in i:
                                        out = False
                                        break
                                else:
                                        out = True
                if out:
                        print(i.strip())
        in_put2.close()

 

 

[root@pc1 test1]# cat rm.list
chr2
chr4
[root@pc1 test1]# python3 test.py        ## 处理结果
>chr1
tttcccggg
>chr3
ccc

 。

 

标签:test1,python,pc1,list,##,序列,rm,fasta,root
From: https://www.cnblogs.com/liujiaxin2018/p/17763749.html

相关文章

  • 手把手带你用Python和文心一言搭建《AI看图写诗》网页项目
    今年年初,ChatGPT的火爆在全球掀起AI大模型的开发热潮,国内外的科技公司纷纷加入“百模大战”行列。百度在率先发布了国内第一款人工智能大语言模型“文心一言”后,又推出了文心千帆大模型平台,帮助企业和开发者加速大模型应用落地。而最近百度创始人、董事长兼首席执行官李彦宏在一场......
  • seqkit 软件根据序列ID删除指定的序列
     001、单个删除(base)[root@pc1test1]#lsa.fa(base)[root@pc1test1]#cata.fa##测试文件>chr1tttcccggg>chr2tttgggjjjcccjjjjjj>chr3ccc>chr4aaaaatt(base)[root@pc1test1]#seqkitgrep-v-p"chr1"a.fa......
  • python程序打包exe
    最前先提醒下,如果项目没有专门的环境,建议搞个虚拟环境打包,这样打包的exe会小点。丢一段虚拟环境命令方便复制:新建虚拟环境:condacreate-nyour_env_namepython=3.8激活虚拟环境:condaacitvateyour_env_name在这个环境里安装好需要的包。 首先安装Pyinstaller,cmd输入:pip......
  • python实现fasta文件碱基序列每行按照指定数目输出
     001、(base)[root@pc1test1]#lsa.fatest.py(base)[root@pc1test1]#cata.fa##测试fasta>chr1tttcccggg>chr2tttgggjjjcccjjjjjj>chr3ccc>chr4aaaaatt(base)[root@pc1test1]#cattest.py##程序#!/usr/bin/envpython3#......
  • 在Python中使用LSTM和PyTorch进行时间序列预测|附代码数据
    全文链接:http://tecdat.cn/?p=8145最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。顾名思义,时间序列数据是一种随时间变化的数据类型。例如,24小时内的温度,一个月内各种产品的价格,一年中特定公司的股票价格诸如长期短期记忆网络(LSTM)之类的高级深度学习模型能......
  • python 实现统计fasta文件每一条序列的长度
     001、a、[root@pc1test1]#lsa.fatest.py[root@pc1test1]#cata.fa##测试fasta>chr1tttcccggg>chr2tttgggccc>chr3cccttt>chr4aaaaattt[root@pc1test1]#cattest.py##统计每条序列的长度#!/usr/bin/envpython3#-*-coding:......
  • 洛谷B2005 字符三角形(python)
    这题重点在如果输入print(a,a,a,a,a),逗号会使输出的时候五个字符之间有空格,应该用a+a+a+a+a。代码如下a=input();print(""+a)print(""+a+a+a)print(a+a+a+a+a) ......
  • Python 集合(Sets)3
    Python-合并集合在Python中,有几种方法可以合并两个或多个集合。您可以使用union()方法,该方法返回一个包含两个集合中所有项的新集合,或使用update()方法,将一个集合中的所有项插入另一个集合中:示例,union()方法返回一个包含两个集合中所有项的新集合:set1={"a","b","c"}se......
  • 使用Python解决面试题:计算青蛙跳上n个台阶的跳法总数
    面试题要求我们计算一个青蛙跳上具有n个台阶的跳法总数,其中青蛙每次可以跳上一个台阶或两个台阶。这是一个经典的递归问题,我们可以使用Python编写一个递归函数来实现。解决方案:我们可以使用递归函数来计算青蛙跳上n个台阶的跳法总数。我们可以考虑最后一步青蛙跳了多少个台阶,以此将......
  • 使用python将txt文件中的ip地址转换成当地城市名称
    具体代码importreimportrequestsimportconcurrent.futures#用于匹配IPv4地址的正则表达式ipv4_pattern=re.compile(r'\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b')#用于发送API请求并获取城市信息的函数defget_city_info(ip):response=requests.get(f'http://ip-......