首页 > 其他分享 >单细胞测序 doublet 二聚体

单细胞测序 doublet 二聚体

时间:2023-10-31 15:01:28浏览次数:32  
标签:液滴 mRNA 二聚体 测序 细胞 单细胞 doublet

Doublets及其形成的原因
单细胞测序期望每个 barcode 标签下只有一个真实的细胞,但是实际数据中会有两个或多个细胞共用一个 barcode 的情况,业内称之为 doublets 或 multiplets(后面统称为 doublets)。Doublets 形成的原因主要是高通量单细胞测序一般使用液滴微流控(droplet microfluidic)或纳米孔(nanowell)技术,细胞被液滴或纳米孔捕获的概率遵循泊松分布规律,doublets 填充液滴的概率会随着输入细胞浓度升高而增加。此外,使用磁珠分选细胞,操作不当也会增加 doublets 形成的概率。

 

 

单细胞测序 doublet 二聚体_数据

 

一般而言,每个GEMs(Gel Bead in emulsion)会形成如上图一般的结构,即一个细胞一个gel beads。但有时候也会出现一个GEM里有0或多个细胞(empty droplet or doublet),对于这种GEMs则需要通过我们在后续分析中识别出来并进行排除。

 

 针对现有几种检测单细胞测序doublet的工具的评估文章,系统比较了常见的例如Scrublet、DoubletFinder等工具在检测准确性、计算效率等方面的优劣,以及比较了使用不同方法去除doublet后对下游DE分析、轨迹分析的影响。

现有的检测方法,基本都会先构造出虚拟doublet,然后将候选droplet与这些虚拟doublet比较,很相似的那些就定义为doublet。这里的虚拟doublet是通过随机组合两个(类)细胞的表达值得到的虚拟的doublet,可以作为检测时的参照。
在现有的9种方法中(Scrublet、doubletCells、cxds、bcds、Hybrid、DoubletDetection、DoubletFinder、Solo、DoubletDecon),文章的结论是DoubletFinder的准确率最高。

 

 

单细胞实验的输入材料通常是生物组织样品。
第一步,单细胞解离:消化组织产生单细胞悬液。为了分别分析每个细胞中的mRNA,必须分离单细胞。根据实验方案不同,单细胞分离的方式也有所不同。

基于平板的技术将细胞分到到板上的孔中。
基于液滴的方法则依赖于微流体液滴捕获单个细胞。

在这两种情况下,都可能出现一些问题,如多个细胞一起被捕获(doublets or multiplets)、非活细胞被捕获或根本没有细胞被捕获(空液滴/孔)。基于液滴的方法需要通过低的输入细胞浓度来保持低的doublets率,因此空液滴是特别常见的 (生信宝典注:一般beads和细胞的输入比例是20:1)。

每个孔或液滴均包含必要的试剂以裂解细胞膜并进行文库构建 (生信宝典注:植物单细胞就要注意了,需要提前去除细胞壁)。文库构建包括捕获细胞内mRNA、反转录为cDNA分子并进行扩增等过程。因为文库构建时每个细胞是独立的,所以每个细胞的mRNA也就特异的标记了孔特异性或液滴特异性细胞barcode。此外,许多实验方案还使用唯一分子标识符(UMI)标记捕获的RNA分子。一般在测序之前需要先扩增细胞cDNA以增加其被检测的可能性。但微量扩增更容易引入PCR偏好性。UMI使我们能够区分测到的reads是来源于mRNA分子的不同扩增拷贝还是来源于独立的mRNA分子,从而可以进行更准确的定量。

每个细胞单独构建的cDNA文库都带有cell barcode和/或UMI(取决于protocol),后续将这些文库混合在一起测序。测序产生的reads数据进行质量控制 ,根据其barcodes序列分组(demultiplexing),并且进行后续比对定量。对基于UMI的protocols,reads的数据可以进一步demultiplexed以得到捕获的mRNA分子的计数(count data)。也就是本套流程的起始输入数据。

 

REF

http://wap.sciencenet.cn/blog-118204-1220240.html?mobile=1

https://cloud.tencent.com/developer/article/1825672  (示例代码)
https://www.jianshu.com/p/ef88433709bd

 



标签:液滴,mRNA,二聚体,测序,细胞,单细胞,doublet
From: https://blog.51cto.com/emanlee/8105506

相关文章

  • 单细胞测序技术 概述
    单细胞测序技术是指在单个细胞水平上对转录组或基因组进行扩增并测序,以检测单细胞在基因组(结构变异-StructuralVariations-SVs;拷贝数变异-Copynumbervariants-CNVs;单核苷酸变异-Singlenucleotidevariants-SNVs等),转录组学(RNA表达水平;转录本的选择性剪接),表观组学(DNA甲基化等),蛋......
  • 单细胞测序 RNA velocity | RNA速率
    单细胞测序RNAvelocity|RNA速率RNAvelocity:thetimederivativeofthegeneexpressionstate—canbedirectlyestimatedbydistinguishingbetweenunsplicedandsplicedmRNAsincommonsingle-cellRNAsequencingprotocols.ahigh-dimensionalvectorthatpredic......
  • linux 中 prefetch命令批量下载sra测序数据
     001、prefetch的安装  002、准备下载sra号的列表  003、设置下载存储目录  004、下载命令 。 参考:https://codeleading.com/article/83981102254/......
  • 重测序数据碱基质量评估
     001、测序数据为fastq格式fastq格式数据没四行为一个单位,其中第二行是碱基,第四行为对应的碱基质量值:如下:(base)[b20223040323@admin1test01]$ls##测试fastq格式数据test.fastq(base)[b20223040323@admin1test01]$head-n4test.fastq|cat-n##第......
  • 为什么要双末端测序
     001、测序时,DNA片段被打断,但是打断的片段仍然很长。二代测序的读长短,为了更多的获取同一个DNA片段上的信息,因此出现了从两端测序,尽可能多的捕获这个DNA片段的信息。  。 ......
  • 2. MGI Pacbio ONT 测序原理
    本人的生物只有高中且4年没碰的水平,如果涉及生物的笔记没写对请见谅.1.总览2.MGI测序原理  MGI属于华大智造的专利技术,同样是用于测序.在解决下面三个问题上使用了不同的方法.(1)如何区分不同碱基:这里可以看作一致,是相似的技术.(2)荧光微弱:滚环扩增,形成DNA纳米......
  • 1. illumina测序原理
    本人的生物水平只有高中且4年没碰的水平,如果涉及生物的笔记没写对请见谅.1.一个典型的生物信息分析  我们在做生物信息分析时,常常是有一个目的,比如分析为什么某朵花是红色的.假设我们在做转录组数据分析,流程一般如下图所示:  得到数据后,我们会进行标准分析,得到一些......
  • 测序深度
        ......
  • 第一二代测序仪
    一代测序:ABI 二代测序:Roche454 IlluminaiSeq100最大读长:2×150bp应用:SmallWhole-GenomeSequencing(microbe,virus),TargetedGeneExpressionProfiling等等最大数据量:1.2Gb时长:9.5–19hrs Hiseq2500最大读长:2×250bp最大数据量:9Gb-1Tb H......
  • 基因测序技术 一二三代
    开通黄钻基因测序技术 基因测序技术基因测序技术的发展前景非常可观,目前为止共出现了三代测序技术,第一代测序技术以Sanger为主;第二代测序是以Illumina为代表的一系列技术;第三代是以PacificBiosciences[4]公司和Nanopore[5]公司的单分子测序为代表的测序技术。如今......