首页 > 其他分享 >RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)

RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)

时间:2023-05-02 22:00:47浏览次数:51  
标签:seq 导图 RNA 样本 测序 reads 转录


前言

NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集)等内容。

 

RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)_数据挖掘

 

之前整理的一篇大综述 — Nature重磅综述 |关于RNA-seq,你想知道的都在这收到了热烈反响,阅读人数过万。

 

RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)_数据挖掘_02

 

行文很长,最后精炼下来的文字近三万,适合深度阅读思考。

上次发出时,有读者留言说部分专业名词不理解。为了方便理解和对综述有个概览,特整理了下面的思维导图,对应原文,共计8个大标题,大标题下又分有小主题,各个分支介绍有每个主题的主要内容及采用方法。

 

RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)_标识符_03

 

内容已发布在石墨文档,链接如下

https://shimo.im/mindmaps/qQVV3r3Pqx8DVGjC/ 《RNA-seq思路图(欢迎大家备注、修改,可先创建副本,在副本文件修改)》,可复制链接后用石墨文档 App 或小程序打开

 

RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)_ci_04

 

Note:想要打开全部分支、添加备注或修改信息,请先创建副本,在备份文件打开修改,原文件不支持修改


 

 

  1. Read depth Read深度:一个样本测序得到的reads数;容易和基因组测序的覆盖度 (多少基因组区域被测到了)和测序深度混淆 (单个核苷酸被测到的次数或所有核苷酸被测到的平均深度)。
  2. Short-read 短读长:测序得到的长度最大是500 bp的reads,常见的测序片段长度为100-300 bp;本文中的短读长测序片段代表测到的mRNA片段和降解了的mRNA。
  3. Long-read 长读长:测序得到的超过1000 bp的reads,本文中代表全长或近乎全长的mRNA。
  4. Direct RNA sequencing (dRNA-seq): 直接测序RNA而非cDNA的测序技术,通常用于测序全长或近全长的mRNA 。
  5. Multi-mapped reads 多重比对的reads:从转录组同源区域测序得到的reads,不能精确确认其转录本或基因组的来源。
  6. Synthetic long reads 合成long reads:通过组装多个短读长得到长读长的方法。
  7. 唯一分子标识符(UMIs):在扩增前,构建RNA-seq文库的时候加入的短序列或barcodes,理想情况下每条转录本结合一个唯一的标识符,含有此标识符的reads都来源于此转录本,定量时只计算一次。可以用来降低RNA-seq的定量偏好性,在RNA起始量低的单细胞实验中尤为适用。
  8. Read length 读长:单个测序reads的长度,short-read RNA测序得到的长度通常是50-150 bp。
  9. Sensitivity 敏感性:样本中多大比例的转录本会被测到,敏感性越高,这一比例越高。它受样本处理、文库制备、测序和计算偏好性的影响。
  10. Specificity 特异性:度量差异表达转录本被正确鉴定出的比例的方法,它受样本处理,文库制备,测序和计算偏好性的影响。
  11. Duplication rates 重复Reads比率:比对到转录组相同位置的的测序reads的比例。在RNA-seq文库中,一些转录本可能有高的重复率,因为它们在样本中表达水平高。高表达的基因的重复率很高,而低表达基因的或许有着最小的重复率。由此RNA-seq面临着一个挑战,该技术中大部分重复可能是高表达转录本带来的真实信号,而另一些则是由于扩增和测序偏好性造成的。
  12. Single-end sequencing 单端测序 (SE):只测序cDNA片段的一端,因其费用低,常用于只关注差异基因表达的项目中。(NGS基础 - 高通量测序原理
  13. Paired-end sequencing 双端测序 (PE):cDNA片段两端分别测序,可以测序到cDNA的更多碱基,更好的识别剪接位点,常于差异基因表达分析项目。
  14. 生物学重复:对生物来源不同的样本的多次检测,比如来自三个个体的组织,用于捕获生物个体自身的变化;这个变化要么是待研究的对象,要么是噪音。相较之下,技术重复是对同样的样本做重复的操作—比如,对一个组织做三次处理。
  15. Expression matrix 表达矩阵:差异表达RNA-seq项目的核心数据文件。每一行代表一个RNA,比如基因或者转录本。每一列是一个测序的样本。矩阵中的数值是每个RNA的reads数。这些可能是对转录异构体的计数估计,并通常在后续的分析前先进行标准化转化。
  16. Spike-in control 内参:按特定浓度添加到样品中的外源核酸库。它们通常是预先合成的不同浓度的RNA,用于监测反应效率和技术方法的偏差和假阴性结果。
  17. Spatialomics 空间转录组学:能保留给定样本(通常是组织切片)中每个转录本的空间信息的转录组分析方法。
  18. Nascent RNA 新生RNA:刚刚转录出来的RNA,与已经加工并运输到细胞质的RNA相对应。
  19. Translatome 翻译组:细胞、组织或生物体中正在翻译成蛋白质的mRNA集合。
  20. Structurome 结构组:细胞、组织或生物体中RNA的二级和三级结构集合。
  21. Interactome 互作组:细胞、组织和生物体中分子相互作用的集合,包括有RNA-RNA或者RNA-蛋白质的相互作用。
  22. Differential gene expression (DGE) 差异基因:两个实验组中表达显著变化的基因。

标签:seq,导图,RNA,样本,测序,reads,转录
From: https://blog.51cto.com/u_16077014/6240232

相关文章

  • 无法将“Autodesk.autocad.livepreview.previewruleprovider”的对象强制转换为类型“
    具体问题如下图所示:在vs2010中调试中,会调用CAD2014,这时就会出现上述的问题错误;经查找,具体的问题是因为:cad的dll引用中,“复制本地”设置为True,因更改为false;这里要注意的是,每个项目中的引用都要更改为false,如Hello项目和InitAndOpt项目中的引用,都要为false,否则这个错误一直会出......
  • tornado服务端+tornado.ioloop.PeriodicCallback定时任务踩坑记录及解决方案
    背景:用tornado部署一个AI模型的服务端,由于AI模型较慢,收到请求肯定没办法同步返回结果,所以最后定的方案是批处理并异步回调。异步回调下,我这边的处理方式是:实时接收所有请求并多线程落库(使用数据库连接池),再启动一个定时任务取出库中(未处理过的)数据进行批处理。因为web框架用的是tor......
  • No service of type Factory<LoggingManagerInternal> available in ProjectScopeServ
    最近从GitHub上down下来一个项目,却在导入到AS的时候一直报Error:NoserviceoftypeFactory<LoggingManagerInternal>availableinProjectScopeServices.这个错误clean一下项目之后,报出了详细错误信息接下来仔细看异常信息,Couldnotcreatepluginoftype'AndroidMavenPlugin......
  • Hibernate的优化
    优化总结要想优化Hibernate,我们必须知道应该从什么地方进行优化,从什么地方入手。Hibernate的优化方向:数据库设计调整HQL优化API的正确使用(如根据不同的业务类型选用不同的集合及查询API)主配置参数(日志,查询缓存,fetch_size,batch_size等)映射文件优化(ID生成策略......
  • isEqual和==区别
    再看文档时留意到isEqual方法,但是我们比较的时候有时候就用==来比较,这2个有似乎没区别呢?网上有人说==来比较指针,isEqual是比较内容,其实这个话如果深究起来,并不是那么准确,我用代码测试了下:1.str1=@"111";2.str2=@"111";3.4.if([str1isEqual:str2]){5.NSLog......
  • Hibernate缓存机制
      Hibernate缓存分类:Hibernate的缓存范围 事务范围的缓存只能被当前事务访问,每个事务都有各自的缓存,缓存内的数据通常采用相互关联的对象形式.缓存的生命周期依赖于事务的生命周期,只有当事务结束时,缓存的生命周期才会结束.事务范围的缓存使用内存作......
  • Django&Tornado&Flask比较
    1.DjangoDjango概述Django太重,除了web框架,自带ORM和模板引擎,灵活和自由度不够高。Django能开发小应用,但总会有“杀鸡焉用牛刀”的感觉。Django的自带ORM非常优秀,综合评价略高于SQLAlchemyDjango自带的模板引擎简单好用,但其强大程度和综合评价略低于Jinja。Django自带ORM也使D......
  • IDEA报错:Internal error :java.lang.illegalAccessErrorjiang
    IDEA报错:Internalerror:java.lang.illegalAccessErrorjiang报错Internalerror:java.lang.illegalAccessErrorjiang原因及解决方法今天在IDEA运行一个新项目时发生了这个报错,原因是该项目使用较新的JDK17版本,而我一直使用的IDEA2019.3.5不支持JDK17,将IDEA版本更换为2021.2.......
  • Hibernate ehcache配置二级缓…
    Cache简介:  )是计算机领域非常通用的概念。它介于应用程序和永久性数据存储源(如硬盘上的文件或者数据库)之间,其作用是降低应用程序直接读写永久性数据存储源的频率,从而提高应用的运行性能。缓存中的数据是数据存储源中数据的拷贝,应用程序在运行时直接读写缓存中的数据,只在某些特......
  • 第四篇:白话tornado源码之褪去模板外衣的前戏
    原笔记博客链接:https://www.cnblogs.com/wupeiqi/p/4592637.html 执行字符串表示的函数,并为该函数提供全局变量本篇的内容从题目中就可以看出来,就是为之后剖析tornado模板做准备,也是由于该知识点使用的巧妙,所有就单独用一篇来介绍了。废话不多说,直接上代码:#!u......