首页 > 系统相关 >linux 中awk语句统计pav 中基因的存在频率

linux 中awk语句统计pav 中基因的存在频率

时间:2023-03-10 18:55:26浏览次数:36  
标签:test2 pav PC1 0.5 awk linux txt root

 

001、测试数据如下:

[root@PC1 test2]# ls
a.txt
[root@PC1 test2]# cat a.txt
1       0       1       0       1       0       1       1
1       1       1       1       1       0       0       0
0       0       1       0       0       0       1       0
0       1       1       0       0       0       1       1

 

以上测试数据中,行为样本,也就是以此为样本1一直到样本4, 列为gene, 矩阵中1表示的是基因的存在, 0表示基因的缺失。

 

002、统计每一个基因在该群体中的存在频率, 实质就是统计每一列中1所占的百分率,这个可以使用awk语句来实现,如下:

[root@PC1 test2]# ls
a.txt
[root@PC1 test2]# cat a.txt
1       0       1       0       1       0       1       1
1       1       1       1       1       0       0       0
0       0       1       0       0       0       1       0
0       1       1       0       0       0       1       1
[root@PC1 test2]# for i in {1..8}; do awk -v a=$i '{ay[$a]++} END {print ay["1"]/NR}' a.txt ; done   ## 输出每一个基因存在频率,第一行对应的是第一列的存在频率, 第二行对应的是第二列的存在频率。。。
0.5
0.5
1
0.25
0.5
0
0.75
0.5

 

 以上语句中for i in {1..8} 是对1到8的数字的以此迭代,可以换成任意递增的数字。

 

标签:test2,pav,PC1,0.5,awk,linux,txt,root
From: https://www.cnblogs.com/liujiaxin2018/p/17204431.html

相关文章

  • Linux 动态库
    Linux的可执行文件一般是elf格式的,在这个可执行文件的头部包含了很多重要的信息:如文件格式,加载地址,符号表等。当链接器链接生成可执行文件时,会将程序的加载地址写入可执行......
  • Linux 性能监控与分析相关的软件包
    检测系统进程和资源使用情况--procps-ngprocps-ng是一个用于检测Linux系统进程和资源使用情况的系统工具,它是procps的一个重写版本。它提供了多种用于检测Linux系统中进......
  • 【Linux】Ubuntu系列简单调优
    是不是觉得你的Ubuntu比别人的慢?是不是并发数不够高?是不是启动个服务慢到怀疑人生?下面是我从网上收集回来的Ubuntu系列的简单性能配置,希望能够帮助到更多的人。1.修改/etc/......
  • ES Linux集群简单搭建
    1环境这里使用的是虚拟机,系统是centos7,jdk11,es7.6.2 2虚拟机安装centos及静态ip配置虚拟机安装centos及静态ip配置 3JDK安装配置安装配置 4先......
  • 如何搭建属于自己的服务器(Linux7.6版)
    从0搭建属于自己的服务器最近小伙伴推荐的华为云活动,购买服务器相当的划算,本人也是耗费巨资购买了一台2核4GHECS云服务器。话不多说,在这里给华为云打一个广子,活动力度还......
  • Linux知识点
    Linux知识点(*)代表扩展,了解即可(#)代表重点,考点密集一、网络操作系统*WindowsXP不会在网络上提供服务二、Linux内核版本号###三、服务器操作系统*......
  • Linux read命令的基本使用!
    在Linux系统中,read命令主要用于读取键盘输入,可以从标准输入中读取一行数据,并把输入行的每个字段的值指定给shell变量。本篇文章主要为大家介绍一下Linuxread命令的基......
  • Linux基本命令
    根据流程,成功安装好软件,在Windows电脑上安装WSL上,并且训练了几项Linux基本命令,发现Linux基本命令相较比较有趣,命令相对比较简洁便于上手。 ......
  • linux之文件最大打开数量
    谈打开文件数,不得不谈文件句柄1.什么是文件句柄?在文件I/O中,要从一个文件读取数据,应用程序首先要调用操作系统函数并传送文件名,并选一个到该文件的路径来打开文件。该函数......
  • Linux安装JDK
    1下载下载相应版本的jdk 2上传到linux并解压缩tar-zxvfjdk-11_linux-x64_bin.tar.gz  3配置环境变量执行命令vi/etc/profile打......