首页 > 其他分享 >5.修改fasta文件成规范文件

5.修改fasta文件成规范文件

时间:2024-03-13 22:29:25浏览次数:30  
标签:__ 文件 format fas sequence 修改 fasta line

 今天遇到一个小问题,整理的fasta参考序列并不规范,如下图所示:

碱基是小写的,并且还空行了,碱基序列不连续,那怎么变成正常的呢?(见下图)

在服务器里我们创建一个py脚本

nano format_fasta.py

 然后把下面代码复制进去

#!/usr/bin/env python

import sys

def format_fasta(input_file, output_file):
    with open(input_file, 'r') as infile, open(output_file, 'w') as outfile:
        sequence = ''
        for line in infile:
            line = line.strip()
            if line.startswith('>'):
                if sequence:
                    outfile.write(sequence + '\n')
                outfile.write(line + '\n')
                sequence = ''
            else:
                sequence += line.upper()  # 将序列转换为大写
        if sequence:
            outfile.write(sequence + '\n')

if __name__ == '__main__':
    if len(sys.argv) != 3:
        print("Usage: python format_fasta.py input.fasta output.fasta")
    else:
        format_fasta(sys.argv[1], sys.argv[2])

然后我们运行脚本:
./format_fasta.py reference.fas formatted-reference.fas

#其中reference.fas是原来的参考库,formatted-reference.fas是规范后的参考库

大功告成!

关注我,以后的内容更精彩哦。
另外如有错误欢迎指正!
b站号:羽球最强生信

微信公众号:小秋的R语言笔记

闲鱼号/淘宝号:小秋家的小卖铺
 

标签:__,文件,format,fas,sequence,修改,fasta,line
From: https://blog.csdn.net/weixin_44282754/article/details/136692788

相关文章

  • mysql修改wait_timeout无效
    今晚本来要搭建一个mysql服务测试那个mysqlhasgoneaway问题的,结果设置wait_timeout死活不生效,找来找去,结果发现最大的问题在于globalvariables的问题。先说最重要的,查看这个变量的方法:showglobalvariableslike'%timeout';或者showglobalvariableslike'wait_......
  • kettle从入门到精通 第五十课 ETL之kettle 课程源文件分享
    Kettle是一款功能强大的开源ETL工具,被广泛应用于数据集成、数据转换和数据加载等领域。随着数据量和多样性的不断增加,使用Kettle进行数据处理已成为许多企业和数据工程师的首选。在过去的几个月里,我已经撰写了将近50篇关于Kettle的文章,涵盖了各种主题和用例,如数据抽取、数......
  • 解决表格文件上传无法删除临时文件的问题Failed to perform cleanup of multipart ite
    java.io.UncheckedIOException:CannotdeleteC:\Users\hasee\AppData\Local\Temp\tomcat如图所示,刚开始以为是apifox没删除的问题,换了之后依旧这样 尝试方案1-失败 方法二-失败 方法三-成功 原文链接报错:StandardServletMultipartResolver:Failedtoperform......
  • Python File(文件) 方法
    在Python中,文件是一种常见的数据存储和交换方式。Python提供了丰富的文件方法来操作和处理文件。以下是关于Python文件方法的详细介绍,并附带多个案例说明:###`open()``open()`方法用于打开文件并返回一个文件对象。语法如下:```pythonfile=open(file_path,mode)``......
  • Python OS 文件/目录方法
    Python的`os`模块提供了丰富的文件和目录操作方法,让我们一起来详细介绍并通过案例说明各种方法的用法:1.获取当前工作目录:```pythonimportoscurrent_dir=os.getcwd()print("当前工作目录:",current_dir)```2.创建目录:```pythonimportosnew_dir="new_direct......
  • 文件上传漏洞
    漏洞描述文件上传漏洞是指由于程序员未对上传的文件进行严格的验证和过滤,而导致用户可以越过其本身权限向服务器上传可执行的动态脚本文件。如常见的头像上传,图片上传,oa办公文件上传,媒体上传,允许用户上传文件,如果过滤不严格,恶意用户利用文件上传漏洞,上传有害的可以执行脚本文件......
  • 在vscode中如何利用快捷键运行python文件
    通常运行python文件只能选择调试运行,或者右键点击需要鼠标点击比较麻烦可以自己设置一个快捷键在上方的搜索框键入>运行python文件点击这个齿轮由于我设置过了快捷键所以能看到Shift+R点击图中的标识,你就能编辑你想要的快捷键随后你就可以用新设置的快捷键在终端直......
  • 文件上传[SUCTF 2019]CheckIn
    文件上传[SUCTF2019]CheckIn打开提交js图片马后台检测文件类型在木马出添加GIF89a绕过显示上传成功的地址uploads/f65a0ca982c669865231909b0ec85a0c上传.user.ini解马关于.user.ini和.htaccess后者有局限性,只能用于apache前者只要能运行php都可用auto_prepend_file......
  • 在Docker容器和主机之间复制文件/文件夹
    简介Docker是一种流行的容器化平台,它允许开发人员在独立、可移植的环境中构建、打包和部署应用程序。在使用Docker时,常常需要在Docker容器和主机之间进行文件的复制和共享。Docker提供了一个名为dockercp的命令,可以轻松地在容器和主机之间复制文件和目录。本文将详细介绍docker......
  • 编写Makefile文件语法,持续更新中~
    一、什么是Makefile?我们写大型项目时,会用到很多源文件,源文件在不同目录中的文件夹里包含着,一个一个编译起来很麻烦,makefile就能够方便我们编译链接。使用makefile进行编译连接时会用到make命令,Makefile的会在执行make命令时指定编译和链接的规则,包括源代码文件之间的链接......