单细胞测序技术
是指在单个细胞水平上对转录组或基因组进行扩增并测序,以检测单细胞在基因组(结构变异-Structural Variations-SVs;拷贝数变异-Copy number variants-CNVs;单核苷酸变异-Single nucleotide variants-SNVs等),转录组学(RNA表达水平;转录本的选择性剪接),表观组学(DNA 甲基化等),蛋白组学多个组学的数据(如下图所示)。
为什么要做单细胞测序以及如何实现单细胞测序?
单细胞测序技术的突出优点是可以从细胞图谱的角度,探测细胞特异性以及细胞间的差异,探索细胞间的协同运作方式,研究组织异质性问题。根据细胞层面的特征对疾病进行深度刻画。
目前的单细胞测序平台
大规模被使用的单细胞测序平台主要有以下五种:
10x Chromium Single Cell Gene Expression Solution;
BD Rhapsody? Single-Cell Analysis System;
Illumina? Bio-Rad? Single-Cell Sequencing Solution;
ICELL8 Single-Cell System;
C1? 单细胞全自动制备系统。
为什么要使用单细胞测序?
对于多细胞生物来说,细胞与细胞之间是有差异的。
比如说,受精卵从一个细胞开始分裂,并逐渐形成囊胚,最终发育成个体的时候,细胞与细胞之间的差异会越来越大:有的分化成神经元,有的分化成骨骼肌,各自表达着不同的遗传信息,承担着不同的生理功能。
又比如在肿瘤组织中,肿块中心的细胞,肿块周围的细胞,淋巴转移灶的细胞,以及远端转移的细胞,其基因组和转录组等遗传信息,是存在差异的。而这种差异,在临床上,可以决定该肿瘤对某种疗法是否有效。
这就是所谓的遗传信息的异质性。
传统的研究方法,是在多细胞水平进行的。因此,最终得到的信号值,其实是多个细胞的平均,丢失了异质性的信息。为了让大家能够更加直观地理解这个问题,看下面这张图:
为了检测某个蛋白质的表达量,可以用Western blot和流式细胞术来实现。但是,用Western blot的话,并没有办法区分上述的情况:目的蛋白只在10%的细胞中强表达,还是在50%的细胞里中等表达,还是在所有细胞中弱表达呢?因为最终电泳跑出来,就是一条差不多强度的带。但如果用流式细胞术这种在单细胞水平对荧光强度加以测定的技术,就能区分上述的情况了。
同样道理,单细胞测序能够检出混杂样品测序所无法得到的异质性信息。而这将带领整个遗传学领域进入新的次元。
需要测多少细胞?
单细胞 RNA-seq 为我们了解组织的组成等提供非常好的工具,而单细胞测序的效果也取决于我们到底测多少细胞,一般而言几百个细胞的单细胞测序不仅仅捕获常见的细胞成分,对于一些稀少的细胞类型也会测到,不过,需要考虑的情况是我们捕获细胞的方法是否具备一定的偏颇?比如不同类型细胞的大小?细胞的形态?是否会对细胞的获取有所倾向?同时我们还需要考虑实验产生的误差,我们需要估计我们所操作的成功率,由于 RNA 降解,细胞的凋亡等,这些数据将会被排除,我们初始选择的细胞个数往往会大于我们目标测序的细胞个数。
需要测多深?
如果我们使用 UMI 计数方法( UMI 计数,是指在建库过程中,通过在引物上,增加随机序列,则对于同一种 mRNA 连上同样的 UMI 概率几乎为 0,则我们可以忽略由于 PCR 造成的误差,对于一种 mRNA,测到的 UMI 数量可以近似看成 mRNA 的表达个数),推荐每一个转录本至少覆盖 3-4 倍,确保一些低表达的 mRNA 不会因为 noise 而被忽略,一般而言,illumina 的一条 lane 中最终可以被使用的数据大概占 50%,另一些 reads 因为实验技术所限,为一些 adaptor 等无效序列。
REF
https://zhuanlan.zhihu.com/p/269461589
https://zhuanlan.zhihu.com/p/28844468
https://www.plob.org/article/11101.html