首页 > 编程语言 >基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究

基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究

时间:2023-05-31 09:46:45浏览次数:43  
标签:变异 检测 测序 Indel SNP 序列

基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究

廖小青

哈尔滨工业大学

摘要:随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP和Indel变异这种小区域的变异,更难以被检测,小位点变异仍然是比较困难的工作。随着时代的发展,检测变异的技术也不断迭代更新,检测的效果也不断提升。从最开始的第一代测序技术到如今的第三代测序技术,先辈们耗费了大量心血,研究出许多方法,为人类的健康做出了卓越的贡献。为了对第三代测序技序列进行分析研究,本文调查研究基于第三代测序技术的SNP和Indel变异检测算法,提出一套检测变异流程。大致分为三步:一是对数据进行特征提取以及找到可能变异的位点和变异信息,二是对可能变异的位点,以此为中心取200bp序列片段进行多序列比对,得到共识序列,三是计算利用贝叶斯统计方法计算变异的基因型概率。其中最重要的方法是多序列比对方法。在原始的多序列比对方法中,数据有很多冗余信息,并且是基于两两比对的方法,这既耗费时间也耗费空间。本论文采用基于偏序图结构的动态规划算法,偏序图结构摒弃了冗余信息,并且在不损失信息的情况下压缩了数据。动...更多 关键词:

单核苷酸变异;插入变异;删除变异;多序列比对;

  • 专辑:

    基础科学

  • 专题:

    生物学

  • DOI:

    10.27061/d.cnki.ghgdu.2020.000734

  • 分类号:

    Q811.4

导师:

刘博;

学科专业:

软件工程(专业学位)

硕士电子期刊出版信息:

年期:2021年第01期网络出版时间:2020-12-16——2021-01-15

标签:变异,检测,测序,Indel,SNP,序列
From: https://www.cnblogs.com/wangprince2017/p/17445145.html

相关文章

  • 基于第三代测序数据的结构变异检测方法研究
    基于第三代测序数据的结构变异检测方法研究白若飞北京化工大学摘要:第三代测序技术的飞速发展使人们能够通过少量较长的读段推测个体的完整染色体序列,同时推动了基因变异检测的发展。结构变异的准确检测对人类遗传多样性和临床疾病的研究至关重要。传统研究结构变异的方法是......
  • 面向第三代测序数据的序列比对方法研究
    面向第三代测序数据的序列比对方法研究高岩哈尔滨工业大学摘要:随着第三代测序技术的不断发展,第三代测序数据在基因组组装、结构变异检测、全长转录本识别等领域得到了广泛的应用。序列比对作为第三代测序数据分析工作流程中最基础、最关键的步骤,一直都是当今生物信息学领......
  • SNP一文解答SAP云迁移的四种部署模式
    为了方便不同需求的用户,多云计算提供商提供了多种形式的云服务,常见的有公有云、私有云、混合云和社区云等。私有云(PrivateClouds)是为一个客户单独使用而构建的,因而提供对数据、安全性和服务质量的最有效控制。该公司拥有基础设施,并可以控制在此基础设施上部署应用程序的方式。私......
  • windows系统下校验测序数据MD5?
    本地上传测序文件到Linux系统,做md5时发现有少数文件失败。$catmd5.check84305_FDSW190448400-1a_1.fq.gz:OK84305_FDSW190448400-1a_2.fq.gz:FAILEDmd5sum:WARNING:1computedchecksumdidNOTmatch可能是上传有误,也可能是本地测序文件本身不完整。但是文件太大,在没......
  • DNA测序中的reads mapping方向的信息
    在DNA测序中,readsmapping方向指的是描绘short-reads(短序列)对于参考基因组的比对方向,即将短读序列与参考基因组进行比对时匹配的方向。这个方向信息通常被编码为“+”或“-”,其中“+”表示reads的5'端与正向链的3'端相对应,“-”表示reads的5'端与负向链的3'端相对应。具体来说,在......
  • 高通量测序分析工具Bedtools使用介绍
    Bedtools是处理基因组信息分析的强大工具集合,其主要功能如下:bedtools:flexibletoolsforgenomearithmeticandDNAsequenceanalysis.usage:bedtools<subcommand>[options]Thebedtoolssub-commandsinclude:[Genomearithmetic]intersectFindove......
  • 利用snpEff对基因型VCF文件进行变异注释的详细方法
    利用snpEff对VCF文件进行变异注释群体遗传研究中,在获得SNP位点后,我们需要对SNP位点进行注释,对这些SNP位点进行更深的了解。snpEff是一个用于对基因组单核苷酸多态性(SNP)进行注释的软件,snpEff软件可以用于对VCF文件进行变异注释,使用时需要先进行安装,然后构建参考基因组数据库,即......
  • R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
    GWAS结果显著SNP位点归类提取与变异类型转化根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性层次进行区分,找出可能性最大的点,过程比较繁琐。这里笔者分享一个算法,使统计SNP和变异类型变的......
  • 高通量测序的数据处理与分析(二)--宏基因组2
    博客原文宏基因组数据处理方法数据下载wget下载宏基因组的数据主要分布在两个数据库:1.NCBI的SRA数据库,2.ENA。近年来也有许多研究者将数据上传到中国的数据库:NGDC你可以直接通过网页下载数据,或者是通过各个网站提供的下载工具进行批量下载。也可以到sra-exporter这个网站......
  • 关于水稻SNP的填充面板(Imputation Panel)
    最近在想,水稻起码已经测序了上万份材料,为什么还没有开发出一个像样的imputationpanel?网上一查,实际上很多人有想过,有做过,也发表过高水平文章。比如3K数据一发表,康奈尔大学的SusanMcCouch就在NC上发表了panel及其imputationpipeline。Animputationplatformtoenhanceinteg......