首页 > 其他分享 >NBT | 基因注释质量评估新工具OMArK,超越BUSCO

NBT | 基因注释质量评估新工具OMArK,超越BUSCO

时间:2024-06-15 22:47:51浏览次数:16  
标签:-- db 基因 OMArK NP BUSCO NBT OMArk 蛋白质

今年2月,Nature Biotechnology在线发表论文:Quality assessment of gene repertoire annotations with OMArk,描述了一个用于评估蛋白质编码基因注释质量的OMArk软件包。

许多研究直接依赖于从基因组组装中预测的蛋白质编码基因库(“蛋白质组”)来进行比较。这样做依赖于以下假设:所有基因组的预测基因含量都具有同质性,并且准确反映了现实。然而,在实践中,这种假设很少得到满足,蛋白质编码基因在报告的蛋白质组中经常缺失或片段化,非编码序列被基因预测因子错误地注释为编码基因,或者来自其他物种的污染被错误地包含在报告的序列中。

新方法OMArk提供了一种轻松全面地测量蛋白质组质量不同方面的方法:基因库的完整性,所包含基因在分类水平上的一致性,它们是否具有可疑的基因结构,以及是否存在域间或域内污染。此外,与现有方法相反,OMArk 不依赖于手动选择参考数据集;相反,它会自动识别测试蛋白质组最可能的分类分类。因此,它可以使用通用参考数据库处理生命之树上的任何测试蛋白质组。

a. OMArk概念和输出的示意图概述。OMArk 提供两个主要的质量评估类别:完整性评估和一致性评估。完整性评估类似于 BUSCO 等方法,但也考虑了多个拷贝的保守基因。一致性评估基于放置在正确谱系的基因家族中的查询蛋白(一致)、错误谱系的基因家族(随机(不一致)或特定物种(污染))和完全没有基因家族(未知)的查询蛋白的比例。b. OMArk 对模式生物斑马鱼的图形输出示例。堆叠条形图的顶部表示完整性评估,条形图的下半部分表示一致性评估。

使用方法

在线版本

地址:https://omark.omabrowser.org/

上传蛋白序列即可。

如果一个基因有多个isoforms,则上传txt文档,区分哪些基因ID为同一基因。

NP_001300751.1;NP_571866.2;XP_005166949.1 NP_001258730.1
XP_005166105.1
NP_001300751.1;NP_571866.2;XP_005166949.1

结果示例:

2个重要评估结果:完整性(Completeness)和一致性(Consistency),都是用柱状图展示,其中missing和unknown比例越少越好。

本地版本

下载OMAmer Database,推荐所有物种,文件为LUCA.h5。

地址:https://omabrowser.org/oma/current/

conda  install  -y -n omark_0.3.0
omamer search --db LUCA.h5 --query pep.fa --out pep.fa.db
mkdir output
omark -f Atha.pep.fa.db -d LUCA.h5 -o output

相比于BUSCO,OMArk的运行速度还是比较快的。

更多使用方法参考Github:https://github.com/DessimozLab/OMArk

标签:--,db,基因,OMArK,NP,BUSCO,NBT,OMArk,蛋白质
From: https://www.cnblogs.com/miyuanbiotech/p/18249878

相关文章

  • nbtstat /?命令参数 显示使用NBT(NetBIOS over TCP/IP)的协议统计信息和当前TCP/IP连接
    NBTSTAT(NetBIOSoverTCP/IPStatistics)是一个用于显示和更新NetBIOS名称缓存、NetBIOS名称表和NetBIOS会话表的Windows命令行实用程序。它允许用户查看当前网络上的NetBIOS名称信息,以便诊断网络连接问题和执行基本的网络故障排除。NetBIOS是一种用于在局域网中进行通信的协议,它......
  • 命令 nbtstat -R 的使用场合
    nbtstat是一个在Windows系统中用于诊断NetBIOSoverTCP/IP(NBT)的命令行工具。NetBIOSoverTCP/IP是一种可以在TCP/IP网络上使用NetBIOS服务的协议。NetBIOS是一种较旧的网络协议,主要用于小型局域网中的名称解析和数据共享。虽然现代网络通常使用DNS进行名称解析,......
  • centos 7中 利用conda 安装busco
     001、利用conda创建py3.7环境,并进入pyt3.7环境condacreate-nbusco-py3.7python=3.7condaactivatebusco-py3.7 002、利用conda安装buscocondainstall-cconda-forge-cbiocondabusco=5.4.7 003、调用测试(busco-py3.7)[root@PC1~]#busco--versio......
  • centos7 中安装 busco
     001、系统[root@PC1software]#cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009(Core) 002、python版本[root@PC1software]#python3--versionPython3.11.3 003、gcc版本[root@PC1software]#gcc--versiongcc(GCC)4.8.520150623(RedHat......
  • Detecting novel systemic biomarkers in external eye photos
    FRIDAY,MARCH24,2023PostedbyBorisBabenko,SoftwareEngineer,andAkibUddin,ProductManager,GoogleResearch Lastyearwepresented results demo......
  • Ubunbtu 中文乱码
    前两天安装了Ubuntu,为了方便命令行操作所以安装的时候系统语言选择的全部都是英文的。现在打开一些中文软件会乱码,执行下面的命令安装下中文字库就好了sudoapt-getinst......
  • python版nbtscan
    python版nbtscan#-*-coding:utf-8-*-importsocketimportsysfromdatetimeimportdatetime#importthreadingimporttimeimportipaddress#识别ip段模块......