- 2024-05-03Linux 中sed命令实现从gff文件中仅仅提取基因名称
001、(base)[b20223040323@admin1x_test]$ls##测试gff文件GCF_000001405.40_GRCh38.p14_genomic.fna.gzGCF_000001405.40_GRCh38.p14_genomic.gff(base)[b20223040323@admin1x_test]$grep-v"^#"GCF_000001405.40_GRC
- 2023-07-02linux 中 shell脚本实现提取gff文件中的最长转录本
001、数据和脚本[root@PC1test2]#lsGCF_001704415.1_ARS1_genomic.gffrecord.sh 002、脚本[root@PC1test2]#catrecord.sh##脚本内容#!/bin/bas##step1:eliminatetheinfluenceofpseudogenegrep-v"^#"GCF_001704415.1_ARS1_genomic.gff|
- 2023-05-16Linux 中 shell 脚本实现根据gff统计每一个基因的转录本数目
001、生成基因名称的列表awk-F"\t"'$3=="gene"&&$NF~/gene=/{print$NF}'chr1.gff|sed's/\(.*\)\(gene=[^;]\+\)\(.*\)/\2/'|sort|uniq>gene.list 002、
- 2023-02-07sed实现从gff文件的第9列提取基因名称
001、[root@PC1test]#lsa.txt[root@PC1test]#cata.txt##测试数据ID=gene-LOC124418406;Dbxref=GeneID:124418406;Name=LOC124418406;gbkey=Gene;gene=L
- 2022-12-28gffread软件实现基因组注释文件gff 和 gtf的相互转换
001、下载测试gff文件,以山羊的gff注释文件为例[root@pc1test]#wgethttps://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/001/704/415/GCF_001704415.2_ARS1.2/GCF_00170
- 2022-11-12linux 中shell 脚本将 gff文件转换为bed文件
001、[b20223040323@admin1test]$ls##测试gff文件exons_only.gff[b20223040323@admin1test]$gff2bed<exons_only.gff>exons_only.bed##gff2bed模块
- 2022-11-04linux 中输出参考基因组gff文件第9列的注释类别
001、[root@pc1test3]#lsGCF_000001405.40_GRCh38.p14_genomic.gff[root@pc1test3]#awk'$3=="gene"{split($9,a,";");for(iina){split(a[i],b,"=")