首页 > 其他分享 >生信:RNA-Seq 比对工具性能比较 [STAR、Tophat2、HISAT2]

生信:RNA-Seq 比对工具性能比较 [STAR、Tophat2、HISAT2]

时间:2023-08-25 18:33:50浏览次数:43  
标签:Tophat2 STAR Seq RNA HISAT2 转录

RNA-Seq 比对工具性能比较

参考文章:

https://yanzhongsino.github.io/2021/11/19/omics_transcriptome.RNA-seq/

https://www.biostars.org/p/288726/

比对 (align) 介绍

序列比对 又称为 align

RNA-Seq 分析中的策略文件类型来看如下:

graph LR FASTQ文件----->SAM文件----->BAM文件

FASTQ文件到 SAM文件这一步就需要比对软件 [STARTophat2HISAT2] 来实现,目的是 把RNA-seq reads比对到合适的参考序列上.

如果用基因组作为参考序列可以检测到的转录本,但可能需要耗费更多的计算资源;如果用转录组作为参考则无法找出新的转录本,但速度更。如果研究物种没有可靠的参考序列,可以重头组装对转录本进行鉴定。这点在本文中不做过多介绍。接下来对RNA的 3 种比对策略进行介绍。

RNA-Seq的 3 种比对策略

STAR

优势在于 ,可以快速 mapping;

缺点在于需要内存大,可能达到 30Gb 左右的 RAM。

采用的算法为:Suffix Tree。可以高效地处理长读,并具有高精度和高敏感性。

Tophat2

现代实验室不常用,其速度较慢,常与Cufflinks连用。

采用的算法为:Bowtie2BWT

HISAT2

作为Tophat2升级版,其主要提升了速度,且低内存消耗。HISAT2在运行速度方面,比STAR快大约2.5倍。对SNP的信息进行了考虑 -- it can better handler known SNPs。

缺点在于没有STAR准确率高。

采用的算法为:改进的BWT方法,并引入了名为hierarchical indexing的概念。这种分层索引策略允许 HISAT2 首先在大的基因组区域中进行比对,然后在局部区域中进行细化比对,这大大提高了比对速度和效率。


附上发展的时间线:

Year Software Name
2009 Tophat
2012 STAR
2013 Tophat2
2015 HISAT
2019 HISAT2

标签:Tophat2,STAR,Seq,RNA,HISAT2,转录
From: https://www.cnblogs.com/honeyShi/p/17657705.html

相关文章

  • Mongodb数据库基于spring-boot-starter-data-mongodb的查询工具
    /***字段注解*/public@interfaceBuilderField{/***对应的数据库字段名称*@return*/Stringname();}importlombok.SneakyThrows;importjava.io.Serializable;importjava.lang.invoke.SerializedLambda;importjava.lang.reflec......
  • 大连人工智能计算平台——华为昇腾AI平台——高性能计算HPC——调度器dstart的ssh启动
     根据华为的官方文档:https://support.huawei.com/enterprise/zh/doc/EDOC1100228705/d1f5a239#ZH-CN_TOPIC_0000001212004449     可以知道,HPC的启动方式如果不指定--mcaplm_rsh_agent方式启动,那么默认的启动方式为ssh方式启动MPI,但是实际操作后发现不可行,报错:s......
  • 画时序图、类图、用例图的神器staruml使用常见问题汇总
    staruml是一款开放源码的UML开发工具,可绘制9款UML图:用例图、类图、序列图、状态图、活动图、通信图、模块图、部署图以及复合结构图等当然还有很多其他工具如SoftwareIdeasModeler,甚至有在线画时序图的:https://www.websequencediagrams.com/,不过速度很......
  • 14.4K Star,一款外观漂亮、运行快速、动画细腻的开源免费UI组件库
    之前给大家推荐了很多后台模版,有读者希望推荐一些跟通用的好看组件,毕竟出了后台还有很多其他场景嘛。所以,今天继续给大家推荐一个广受好评的UI组件库:NextUI主要特性NextUI的主要目标是简化开发流程,为增强的用户体验提供美观且适应性强的系统设计。它有以下几点核心特性:可个......
  • public async void Start(){ await 函数 } 相当于是同步方法吗?
    在C#中,使用`async`和`await`关键字可以创建异步方法。异步方法不会阻塞当前线程,允许程序在等待耗时操作的同时继续执行其他任务。在你的代码中,`publicasyncvoidStart()`是一个异步方法的声明。然而,与同步方法不同,`await`关键字会将控制权返回给调用方,允许其他操作继续......
  • 生信:一起学生信分析 RNA-Seq上游 篇
    一起学生信分析RNA-Seq上游篇参考文章:https://zhuanlan.zhihu.com/p/345896914RNA-Seq分析介绍转录组是指某特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究......
  • 深度学习(十二)——神经网络:搭建小实战和Sequential的使用
    一、torch.nn.Sequential代码栗子官方文档:Sequential—PyTorch2.0documentation#UsingSequentialtocreateasmallmodel.When`model`isrun,#inputwillfirstbepassedto`Conv2d(1,20,5)`.Theoutputof#`Conv2d(1,20,5)`willbeusedastheinputto......
  • 生信:一起学生信分析 RNA-Seq下游 篇
    一起学生信分析RNA-Seq下游篇DESeq2介绍专为高通量测序数据(特别是RNA-seq数据)设计,用于分析计数数据的差异表达,同样功能的还有limma和edgR。差异表达分析使用DESeq2进行差异分析本教程使用的数据下载链接:表达矩阵matrix_clean.txt下载:https://wwry.lanzouq.com/i6w......
  • CF670E Correct Bracket Sequence Editor
    思路发现此题除了模拟没有好的方法,所以考虑如何模拟。先考虑删除操作,如果在删除的时候再去找要删除那些的话,就会使时间复杂度变高,所以考虑先预处理出每个括号对应的位置。如果按照操作删除括号,那么时间复杂度也是非常吓人的。所以我们考虑标记被删除的括号。再考虑移动操作,如果......
  • spring-boot-starter
    springboot在配置上相比spring要简单很多,其核心在于spring-boot-starter,在使用springboot来搭建一个项目时,只需要引入官方提供的starter,就可以直接使用,免去了各种配置。starter简单来讲就是引入了一些相关依赖和一些初始化的配置命名规范:官方的starter:spring-boot-start......