首页 > 系统相关 >linux中awk命令对fastq格式的碱基质量体系进行判断

linux中awk命令对fastq格式的碱基质量体系进行判断

时间:2023-09-30 22:22:38浏览次数:33  
标签:min fastq 碱基 test awk linux print

 

001、

[root@pc1 test]# ls
a.fastq
[root@pc1 test]# head -n 4 a.fastq        ## 测试fastq格式数据
@SRR12342886.1 1/1
TCTTCAAAAATTTCTCACAGCTTGTTGTGATCCACACAGTCAAAGGCTTTAAGTGTAGTCAGTGAAGCAGAAGTGGATATTTTTCTGGAATTCCCTTGCTTTCTCTGTGATCCAAGGGATTTGATCTCTGGTTCCTCTGCTTTTTCTAAAC
+
FFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFF:F
[root@pc1 test]# head -n 12 a.fastq | awk '{if(NR%4==0) printf("%s",$0);}' | od -A n -t u1 -v | awk 'BEGIN{min=100;max=0;} {for(i=1;i<=NF;i++) {if($i>max) max=$i; if($i<min) min=$i;}} END {if(max<=126 && min<59) print "Phred33"; else if(max>73 && min>=64) print "Phred64"; else if(min>=59 && min<64 && max>73) print "Solexa64"; else print "Unknown score encoding";}'
Phred33                   ## 判断程序,逻辑是将碱基质量值转换为数值,然后对质量值数值的区间进行计算,利用碱基质量的范围进行判断

 

 

。 

参考:https://mp.weixin.qq.com/s?__biz=Mzg4NzA4MzUxOA==&mid=2247486721&idx=1&sn=c268b78f600d9acbe25831a62a47df12&chksm=cf8e9590f8f91c861157fe3dcbc8439826ba8134f7de67515de23409d746c6d34892695fcfee&cur_album_id=3101294931740213257&scene=189#wechat_redirect

 

标签:min,fastq,碱基,test,awk,linux,print
From: https://www.cnblogs.com/liujiaxin2018/p/17738324.html

相关文章

  • linux 中删除文本中所有的换行符
     001、tr实现[root@pc1test02]#lsa.txt[root@pc1test02]#cata.txt##测试文件01020304050607080910[root@pc1test02]#cata.txt|tr"\n"""##删除所有的换行符01020304050607080910[root@pc1test02]#cata.txt|......
  • linux 中 将ASCII码 转换是十进制数值
     001、[root@pc1test]#echo-n!|od-An-tu1##将ASCII码感叹号转换为十进制数值33 002、[root@pc1test]#echo-n!|od-An##将ASCII感叹号转换为8进制数值000041 003、[root@pc1test]#echo-n!|od-An000041[root@pc1t......
  • NO.6 Linux系统编程-备忘
    一、文件I/OFILE*fp指针(指向的结构体有三个重要的成员)文件描述符:通过文件描述可以找到文件的inode,通过inode可以找到对应的数据块文件指针:读和写共享一个文件指针,读或者写都会引起文件指针的变化文件缓冲区:读或者写会先通过文件缓冲区,主要目的是为了减少对......
  • windows&linux共享
    优点:可以使用VS直接编辑linux跨平台代码apt-getinstallsambavim/etc/samba/smb.conf[code]//名称path=/code//路径writeable=yesbrowseable=yesguestok=yespkillsmbdsmbd//启动ps//显示当前终端的进程ps-ef|grepsmbd//|表示管道的输出;grep是过滤mk......
  • Linux第二周技术博客
    这周我们学习centos7的安装首先我们先去centos官方找到centos7版本的安装包以及它的镜像文件。安装好centos7后我们打开VMware选择创建新的虚拟机然后一直点击下一步到选择安装来源界面,将我们之前下载的镜像文件放入然后选择安装Linux系统,给虚拟机起好名字后将文件位置修改好点......
  • Laxcus分布式操作系统相比Linux操作系统的优势
    一位微信网友的提问:LAXCUS分布式操作系统和LINUX操作系统相比,有什么优势?答:LAXCUS分布式操作系统做为一种新型的多机操作系统,是操作系统家族的新物种。它最大的特点是聚合能力,能够将海量的物理计算机集合到一起,变成一台物理分散逻辑统一的单台计算机,在此基础上,实现超大规模算力的......
  • 运维 | 如何卸载阿里云盾 | Linux
    运维|如何卸载阿里云盾|Linux官方文档:https://help.aliyun.com/document_detail/68616.htm?spm=a2c4g.11186623.2.7.2537646azwEGcG#concept-cwf-hzc-zdb问题描述最近新购了阿里云的VPS,发现之前的卸载阿里云监控的方法已经失效应该是加了守护,没法直接删除相关文件,提示Op......
  • NO.3 C语言实现贪吃蛇游戏(Linux)
     一、简易说明:实现了初步的游戏模型,可以玩,但有一些细节bug没有解决。用WASD控制方向  二、源代码+头文件1#include<stdio.h>2#include"snake.h"34567intmain(intargc,constchar*argv[])8{91011system("cl......
  • Linux下C语言操作网卡的几个代码实例?特别实用
    前面写了一篇关于网络相关的文章:如何获取当前可用网口。《简简单单教你如何用C语言列举当前所有网口!》那么如何使用C语言直接操作网口?比如读写IP地址、读写MAC地址等。一、原理主要通过系统用socket()、ioctl()、实现intsocket(intdomain,inttype,intprotocol);功能:......
  • Linux常用命令本地查询工具:LinuxStudy 1.0
    最近在学习Linux,上千的命令整理了一下,随用随查,也分享给需要的小伙伴。语言平台为C#framework4.7.1,旧系统可能需要更新平台。程序开源,可关注https://gitee.com/windtrace/linux-study新版本。目前收集了www.linuxcool.comhttps://github.com/jaywcjlove/linux-command两个......