GB | Seqrutinator：一个用于鉴定和去除非功能性序列的基因家族分析流程

时间：2024-10-06 22:00:29浏览次数：8

标签：功能性基因 Seqrutinator NFHs GB 移除序列 MSA

分享一篇近期发表在 Genome Biology 上的一个基因家族分析软件：Seqrutinator。该软件用于识别和去除基因家族数据集中的无功能基因，包括假基因、测序错误、基因结构错误、比对错误等，从而避免基因家族鉴定中的假阳性结果，进一步确保基因家族注释的准确性，以便于后续系统发育分析和功能聚类。

背景意义

目前，基因家族鉴定流程并无唯一标准，但大多是基于 Blast 和 Hmmer，再辅以手工校正。无标准鉴定流程，导致不同流程、不同参数、不同校正过滤标准，都会对同一基因家族鉴定数目和基因上存在差异，从而对后续结果产生影响。

准确构建超家族系统发育树和进行多序列比对（MSAs）仍然是一个主要研究领域。为了提高MSA的质量，研究人员经常修剪掉不太可靠的列，但这可能会丢失信息。此外，非功能性同源物（Non-Functional Homologues, NFHs）提供的序列信息通常被视为噪声，可能会干扰MSA的正确处理。

Seqrutinator的设计

Seqrutinator的设计理念是提供一个目标序列审查方法，用于检测和移除NFHs。该工具通过四个假设来识别NFHs：短序列不太可能是功能性的；NFHs可能在MSA中引起大量连续的间隙丰富的列；NFHs可能在MSA中显示出大量连续的间隙；以及与超家族的HMMER剖面相比，伪基因和其他类似序列可能具有低相似性和低分数。

Seqrutinator由五个模块组成，包括短序列移除器（SSR）、非同源命中移除器（NHHR）、间隙引发器移除器（GIR）、连续间隙序列移除器（CGSR）和伪基因移除器（PR）。用户可以选择模块、它们实施的顺序以及影响自动化审查和过滤严格性的设置。

Seqrutinator 流程示意图

Seqrutinator的性能评估

研究者使用了19个完整的蛋白质组数据集，包括16种植物物种、两个版本的拟南芥蛋白质组以及两个版本的SwissProt数据集。通过Seqrutinator处理后，发现在拟南芥蛋白质组中移除的序列数量相对较少，而在最近发布的松树蛋白质组中移除的序列数量超过80%。这表明Seqrutinator能够一致地识别和移除NFHs。

Seqrutinator的应用效果

Seqrutinator处理后，MSA的质量得到了显著提高。通过使用BMGE工具修剪MSA，发现处理后的MSA中可靠列的数量显著增加。此外，Seqrutinator处理后的序列集在进行HMMERCTTER聚类分析时，产生了更大和更少的聚类，这表明Seqrutinator有效地去除了NFHs，而不是功能性同源物（Functional Homologues, FHs）。

讨论与结论

Seqrutinator是一个有效的工具，可以帮助自动化地挖掘蛋白质超家族序列，并且只要序列是真正同源的，它就能提供良好的结果。对于更复杂的情况，应该将序列分割成真正同源的子集以获得最佳结果。Seqrutinator的开发和测试表明，它是一个灵活且一致的工具，能够在不同数据集上识别和移除NFHs，从而改善MSA的质量，并为后续的系统发育分析和功能聚类提供更准确的数据集。

数据和材料的可用性

所有数据集均来自公共序列集。Seqrutinator软件（包括辅助脚本MuFasA和SeqYNet）代码可以在GitHub或Zenodo的存储库中免费下载。

Github：https://github.com/BBCMdP/Seqrutinator

标签：功能性,基因,Seqrutinator,NFHs,GB,移除,序列,MSA
From： https://www.cnblogs.com/miyuanbiotech/p/18449481

SpringBoot 多元化配置（正则表达式，配置文件优先级）
1.配置绑定所谓“配置绑定”就是把配置文件中的值与JavaBean中对应的属性进行绑定。通常，我们会把一些配置信息（例如，数据库配置）放在配置文件中，然后通过Java代码去读取该配置文件，并且把配置文件中指定的配置封装到JavaBean（实体类）中。SpringBoot提供了以下2种方式进行配......
基于java+springboot的酒店预定网站、酒店客房管理系统
该系统是基于Java的酒店客房预订系统设计与实现。是给师弟开发的毕业设计。现将源代码开放出来，感兴趣的同学可以下载。演示地址前台地址：http://hotel.gitapp.cn后台地址：http://hotel.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://git......
基于java+springboot的租房网站、房屋出租管理系统
该系统是基于java+springboot+vue开发的租房管理系统。是给师弟开发的课程作业。学习过程中，遇到问题可以留言咨询。演示地址前台地址：http://zf.gitapp.cn后台地址：http://zf.gitapp.cn/admin后台管理帐号：用户名：admin123密码：admin123源码地址https://github.com/g......
java毕业设计-基于Springboot的助农产品采购平台【代码+论文+PPT】
全文内容包括：1、采用技术；2、系统功能；3、系统截图；4、部分代码；5、配套内容。索取方式见文末微信号，欢迎关注收藏！一、采用技术语言：Java1.8框架：SSM数据库：MySQL5.7、8.0开发工具：IntelliJIDEA旗舰版其他：Maven3.8以上二、系统功能商家管理：负责商家入驻、审核、信息及商品上架权限......
基于SpringBoot+Vue+协同过滤算法的音乐推荐系统设计与实现(源码+论文+PPT+部署文档教
具体实现截图网站首页页面主要包括系统首页、热门歌曲、音乐资讯、留言板、个人中心等内容，并根据需要进行详细操作；如图5-1所示：图5-1网站首页界面图在注册流程中，用户在Vue前端填写必要信息（如用户名、密码等）并提交。前端将这些信息通过HTTP请求发送到Java后端。后端处理......
springboot+vue基于的电商购物系统【开题+程序+论文】
系统程序文件列表开题报告内容研究背景随着互联网技术的飞速发展，电子商务已成为现代社会不可或缺的一部分。电子商务不仅改变了人们的购物方式，还极大地推动了全球经济的发展。近年来，电商平台如雨后春笋般涌现，市场竞争日益激烈。为了在激烈的市场竞争中脱颖而出，电商平台需要......
springboot+vue基于SpringBoot的经典诗文学习平台【开题+程序+论文】
系统程序文件列表开题报告内容研究背景在信息化高速发展的今天，传统文化的学习与传播方式正经历着深刻的变革。经典诗文作为中华文化的瑰宝，承载着千年的智慧与情感，对于提升国民文化素养、增强民族认同感具有重要意义。然而，传统的学习方式如翻阅纸质书籍、参加诗词讲座等，在时......
帝国CMS GBK编码使用AJAX提交数据中文乱码问题！
在帝国CMS使用GBK编码的环境中，通过AJAX提交数据时可能会遇到中文乱码的问题。这是因为AJAX默认使用UTF-8编码，而帝国CMS使用的是GBK编码。解决这个问题的关键是在接收数据的PHP文件中对数据进行编码转换。解决方案在接收数据的PHP文件中进行编码转换：使用 iconv 函数将接收......
电影《志愿军存亡之战》百度云下载/迅雷磁力下载高清版4K资源8.26GB
电影《志愿军：存亡之战》观后感电影《志愿军：存亡之战》是由陈凯歌执导，张珂编剧，汇聚了朱一龙、张子枫、辛柏青、吴京等众多实力派演员的战争历史剧情片。该片作为《志愿军》系列影片的第二部，于2024年9月30日在中国大陆上映，讲述了抗美援朝战争中第三次战役到第五次战役中的......
springboot社区管理系统-计算机毕业设计源码68405
基于微信小程序的社区管理系统的设计与实现摘要随着移动互联网的快速发展，微信小程序作为一种轻量级的应用程序，因其便捷性、易用性和广泛的用户基础，已成为连接用户与服务的重要桥梁。特别是在社区管理领域，微信小程序以其独特的优势，为社区提供了一个全新的管理和服务模式。......