首页 > 其他分享 >1. illumina测序原理

1. illumina测序原理

时间:2023-09-19 17:46:34浏览次数:38  
标签:片段 DNA illumina PCR 碱基 测序 序列 原理

本人的生物水平只有高中且4年没碰的水平,如果涉及生物的笔记没写对请见谅.

1. 一个典型的生物信息分析

  我们在做生物信息分析时,常常是有一个目的,比如分析为什么某朵花是红色的.假设我们在做转录组数据分析,流程一般如下图所示:
image
  得到数据后,我们会进行标准分析,得到一些信息比如基因表达信息、突变信息等,这个过程的计算量很大,需要在服务器上分析.完成标准分析后,得到的信息就比较小.比如转录组学可以得到一个表达矩阵,每个值代表每个基因的表达水平高低.得到矩阵后,又可以继续分析,比如富集分析,这一步我们称为数据挖掘(这一步可以在个人笔记本上).

2. 方向

  前面是生信的基本内容,后续我们可以在不同方向发展自己的技能.比如本人就是机器学习算法方向(.)
image

3. 测序技术发展时间线

  测序的reads长度一直往高方向发展.(reads:给与一个基因片段,用测序仪一次测序X个碱基,称为reads长度.)
image

3.1 主流测序仪

  目前市场主流的测序仪主要为4台.左边主要是二代测序仪,右边是三代测序仪(第4个有时候被称为4代测序仪).
image

4. illumina测序

4.1 原理

  核心原理是边合成边测序.当我们想测序一条DNA序列,会使用类似PCR的方法.如果我们知道正在合成的DNA序列的碱基,那么需要测序的DNA序列可以推断出来.
  我们用荧光标记正在合成的碱基,不同的碱基发出不同的颜色,每合成一个碱基就暂停一下(核酸以磷酸二酯键相连,可以不让他们相连,使用阻断基团),观察颜色,就知道在合成什么碱基了.
  但是也有光线太弱不易观察的问题,解决方法是使用桥式PCR,将一个DNA片段扩展大量DNA片段,这样光线信号就会变强.
image

4.2 过程

  先看右边的图.假如我们要测右边的三个DNA片段,首先我们要把这3个基因片段种植到\(flowcell\)(可以理解为基因芯片)上,使用的方法是在DNA片段上接上接头序列.注意一下这个flowcell上有两种DNA引物,这两种引物与接下来要使用的DNA接头序列相互互补.
image
  有两种接头序列,一种是P5序列,一直称之为P7序列.这是为了让我们将DNA fragment种植到芯片上.种植到芯片上就会形成一个"桥".以红色的片段为例,再利用PCR进行合成,会形成双链DNA片段,合成后桥又会打开,从原来的一个DNA片段变成两个DNA片段.这两个片段再弯腰进行合成,不断重复会形成一个cluster.这个cluster的DNA片段有的是头朝上有的是脚朝上,我们要同时测序就必须保证cluster内的DNA片段一致,所以用化学方法将不同的DNA片段去掉.此时进行同时测序,利用荧光识别DNA序列.
image
  上面讲得很简略,建议看这个Click非常详细.
  这里必须要声明一下,DNA分子存储在染色体上,而DNA分子是很长的.我们这样测序最多左边测一下,右边测一下,这样就会显得很浪费,因此我们需要用超声波将DNA分子打断,形成一个个片段,然后进行长度选择,用合适的片段进行测序.除此之外,选择打断的另一个原因是如果DNA片段太长,形成桥状的时候会引申到其他cluster去,此时就会扰乱其他cluster的荧光识别.
  请注意,我们选择长度必须要选择差不多的.假如我们选择一个长的DNA片段和一个短的DNA片段,当进行桥式PCR时,短的DNA片段就会比长的多得多.此时测序就会有一个偏向性,当长的DNA片段测一次后,短的DNA片段可能已经测很多次了.此外,我们送去测序的DNA片段有数量要求,如果片段不够就会需要使用PCR扩增,如果长度相差大又会带来一个偏向性.长短是可以进行人为干涉的,但是如果某个DNA片段GC碱基含量高,合成也会较慢,相同时间PCR扩增就没有那么多,这种因素是难以避免的.
image

标签:片段,DNA,illumina,PCR,碱基,测序,序列,原理
From: https://www.cnblogs.com/newblg/p/17714648.html

相关文章

  • 【原创】DHCP工作原理(整理)
                                                               DHCP工作原理 dhcp(DynamicHostconfigureprotocol,动态主机配置协议),用于向网络中......
  • 全网最详细的OSPF原理总结,看这篇就够了!
    大家好,我的网工朋友。OSPF是一种基于链路状态的路由协议,也是专为IP开发的路由协议,直接运行在IP层上面。它从设计上保证了无路由环路。除此之外,IS-IS也是很常见的链路状态协议。为什么会出现OSPF?作为目前主流的IGP协议,OSPF主要是为了解决RIP的三大问题而出现的,比如:收敛很慢、容......
  • 简述为什么通信原理中正数的相频是0
    在通信原理中,正弦信号的相位通常用相位的相对变化来表示,而不是用绝对相位值。因此,对于正数频率的信号,其相位的相对变化为0,也就是相频为0。具体来说,对于一个正弦信号,其可以表示为:x(t)=Asin(ωt+φ)其中,A为振幅,ω为角频率,φ为初始相位。对于不同的频率成分,其相位是不同的。如果我们对......
  • 简述为什么通信原理中正数的相频是0
     在通信原理中,正弦信号的相位通常用相位的相对变化来表示,而不是用绝对相位值。因此,对于正数频率的信号,其相位的相对变化为0,也就是相频为0。具体来说,对于一个正弦信号,其可以表示为:x(t)=Asin(ωt+φ)其中,A为振幅,ω为角频率,φ为初始相位。对于不同的频率成分,其相位是不同的。如......
  • MySQL主从复制原理
    一张图让你牢记MySQL主从复制原理|原创(qq.com)为什么需要主从复制?1、读写分离,增强MySQL数据库的可用性。2、做数据的热备。3、架构的扩展。业务量越来越大,I/O访问频率过高,单机无法满足,此时做多库的存储,降低磁盘I/O访问的频率,提高单个机器的I/O性能。说说BinlogMySQL的Server......
  • 从内核世界透视 mmap 内存映射的本质(原理篇)
    本文基于内核5.4版本源码讨论之前有不少读者给笔者留言,希望笔者写一篇文章介绍下mmap内存映射相关的知识体系,之所以迟迟没有动笔,是因为mmap这个系统调用看上去简单,实际上并不简单,可以说是非常复杂的一个系统调用。如果想要给大家把mmap背后的技术本质,正确地,清晰地还原......
  • 深入了解视频直播美颜sdk技术:实现美颜效果的核心原理
    在当今数字化社交和娱乐的时代,视频直播已经成为人们日常生活中的重要组成部分。从个人博客到专业直播平台,人们都渴望在镜头前呈现出最佳的形象。这就引入了视频直播美颜技术,它不仅改善了主播的外观,还提高了直播观众的观看体验。本文将深入探讨视频直播美颜sdk技术,揭示实现美颜效果......
  • Tomcat原理与使用
    原理Web服务器与Web应用通过Servlet接口来协作Servlet规范Web应用与Web服务器进行协作的一系列标准Java接口(JavaServletAPI)和Web服务器发布运行Web应用的一些细节Servlet容器:能够发布和运行JavaWeb应用的Web服务器。能动态执行JavaWeb应用中Servlet实现类的代码。Tomcat是一个符......
  • Cadence应用笔记:批量修改原理图元器件属性
    OrCad批量修改元器件属性方法软件内修改过滤选择Part、随后Ctrl+A全选,再右键选择修改导出/导入Excel修改点中.DSN文件,随后在工具栏Tool中选择导出......
  • Nacos深入原理从源码层面讲解
    目录1Nacos原理1.1Nacos架构1.2注册中心原理1.3SpringCloud服务注册1.4NacosServiceRegistry实现1.4.1心跳机制1.4.2注册原理1.4.3总结1.5服务提供者地址查询1.6Nacos服务地址动态感知原理1Nacos原理1.1Nacos架构ProviderAPP:服务提供者ConsumerAPP:服务消费者......