首页 > 系统相关 >linux 中 shell 实现从fasta中提取任意的scaffold数据

linux 中 shell 实现从fasta中提取任意的scaffold数据

时间:2022-12-23 15:14:18浏览次数:39  
标签:test2 sed ## scaffold pc1 fa shell linux root

 

001、测试数据

[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa    ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg

 

 

 

002、sed命令实现提取任意的scaffold数据:

提取scaffold1

[root@pc1 test2]# cat a.fa
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr1/,/^>/p' a.fa | sed '1b; />/d'   ## 提取scaffold1
>chr1
ddtttggggg
eeeeee

 

 

003、提取scaffold3

[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa       ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr3/,/^>/p' a.fa | sed '1b; />/d'   ## 提取scaffold3
>chr3
uuuuueeeee
qqqqqqqqq

 

 

004、提取scaffold5

[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa            ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr5/,/^>/p' a.fa | sed '1b; /^>/d'    ## 提取scaffold5
>chr5
yyyyyyy
ggggggg

 

标签:test2,sed,##,scaffold,pc1,fa,shell,linux,root
From: https://www.cnblogs.com/liujiaxin2018/p/17000685.html

相关文章

  • Day01_04_Linux_Ubuntu教程之安装配置 Java 开发环境
    一.Linux安装配置Java开发环境1.概述此处在Ubuntu18.04系统下以jdk-8u211-linux-x64.tar.gz.zip为例2.下载地址​​http://www.oracle.com/technetwork/java/javase/......
  • Day01_06_Linux_Ubuntu教程之安装配置MySQL
    Linux安装MySQL服务器及客户端本教程以ubuntu18.04系统为例1.安装mysql1.1更新ubuntu的source数据源apt-getupdate1.2安装mysql-serverapt-getinstallmysql-server......
  • Linux 查找进程所在目录
    查找进程所在目录位置#打出进程ID[root@iZuf64tp28136djioi3ki8Z/]#ps-ef|grepredisroot345110Jun10?07:02:26./redis-server*:9868roo......
  • linux 管道
    linux进程或者线程间通信的一种方式管道本质上就是一个文件,前面的进程以写方式打开文件,后面的进程以读方式打开。这样前面写完后面读,于是就实现了通信linux的设计思路就......
  • [ Linux ] 死锁以及如何避免死锁
    1.什么是死锁?死锁死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所占用不会释放的资源而处于的一种永久等待的状态。2.模拟死锁情况我们使用多......
  • 文件目录结构、文件命名规范、文件系统结构、linux应用程序的组成、绝对路径和相对路
    文件目录结构文件和目录被组织成一颗倒置的树状结构文件系统从根开始,“/”文件名称严格区分大小写隐藏文件以"."开头路径的分隔符为"/"文件命名规范文件字符最长为255个字符......
  • Linux服务器安装python3.7环境
    安装python3.7依赖yum-yinstallzlib-develbzip2-developenssl-develncurses-develsqlite-develreadline-develtk-develgdbm-develdb4-devellibpcap-develxz-......
  • linux 命令使用5--mpstat
    简介:    mpstat是MultiprocessorStatistics的缩写,是实时系统监控工具。其报告与CPU的一些统计信息,这些信息存放在/proc/stat文件中。在多CPUs系统里,其不但能查看......
  • Linux常用命令
    常用命令书写命令要用空格分开,一个或多个都可以ping是命令符www.baidu是参数如果不知道要用的命令可以借助Linux命令大全help找命令的帮助whereis查询命令的位置file查看文......
  • Mac VSCode启动提示(无法在合理的时间内解析shell)
    问题描述VSCode启动提示:无法在合理的时间内解析shell原因分析nvm如果在shell初始化期间运行,会导致shell启动时间变慢解决方法修改文件~/.bash_profilefunctionlo......