基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究
廖小青
哈尔滨工业大学
摘要:随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP和Indel变异这种小区域的变异,更难以被检测,小位点变异仍然是比较困难的工作。随着时代的发展,检测变异的技术也不断迭代更新,检测的效果也不断提升。从最开始的第一代测序技术到如今的第三代测序技术,先辈们耗费了大量心血,研究出许多方法,为人类的健康做出了卓越的贡献。为了对第三代测序技序列进行分析研究,本文调查研究基于第三代测序技术的SNP和Indel变异检测算法,提出一套检测变异流程。大致分为三步:一是对数据进行特征提取以及找到可能变异的位点和变异信息,二是对可能变异的位点,以此为中心取200bp序列片段进行多序列比对,得到共识序列,三是计算利用贝叶斯统计方法计算变异的基因型概率。其中最重要的方法是多序列比对方法。在原始的多序列比对方法中,数据有很多冗余信息,并且是基于两两比对的方法,这既耗费时间也耗费空间。本论文采用基于偏序图结构的动态规划算法,偏序图结构摒弃了冗余信息,并且在不损失信息的情况下压缩了数据。动...更多 关键词:- 专辑:
基础科学
- 专题:
生物学
- DOI:
10.27061/d.cnki.ghgdu.2020.000734
- 分类号:
Q811.4
刘博;
学科专业:软件工程(专业学位)
硕士电子期刊出版信息:年期:2021年第01期网络出版时间:2020-12-16——2021-01-15
标签:变异,检测,测序,Indel,SNP,序列 From: https://www.cnblogs.com/wangprince2017/p/17445145.html