基于学习的第三代测序一致性序列生成

摘要：继人类基因组计划开展以来,基因测序已经广泛影响了生命科学的研究方式,各模式物种基因组在全球实验室不断被测定分析。近年来随着基因组测序数据通量的提升和成本的下降,这已成为生物医学领域的常规手段。目前以太平洋生物科技公司以及牛津纳米孔技术公司长读长测序为代表的第三代测序技术可以产生足够长度的测序片段,极大推动了基因组组装、变异检测等分析领域的发展。然而第三代测序序列具有极高的错误率(～15%),影响了分析结果的精度,局限了其在医学研究和临床诊断中的应用。因此科学家致力于开发出更高效的分析方法,以打破这种限制。基因组组装是从大量随机测序获得的短片段重建出几M甚至上百M基因组长序列的过程,最终目标是生成完整、准确的一致性序列。第三代测序技术的应用极大提高了基因组一致性序列的完整性,但测序的高错误率却限制了其准确性。尤其是在组装重复序列以及单倍型时,获得高质量且准确的一致性序列仍存在挑战。生成一致性序列的关键在于获得准确的多序列比对结果,考虑到第三代测序序列长读长、高错误率及高通量的特点,需要资源密集型的序列纠错以及一致性序列生成的步骤来获得高质量的组装结果。本研究提出了包含深度学习和强化学习方法的多序列比对及一致性序列生成模型,不仅可以提升比对的结果,同时也能得到准确率更高的基因一致性序列,本论文主要进行了以下三项研究工作:(1)提出基于强化学习的方法对基因数据的比对进行调整,采用异步的优势演员评论家算法进行比对策略的学习。目前主流的多序列比对方法仍存在较大不足,因此希望通过有效的策略进行比对决策使其结果得到提升。(2)提出好奇心奖励,解决多序列比对问题中累计回报较少的问题,对结果进行进一步的调整,使其不仅在评价指标上有更好的结果,而且更加接近生物学实际意义、即更符合基因序列的结构特征。(3)引入深度学习的方法提取多序列比对结果的结构特征,结合不同通量序列数据的特点,生成准确率更高的一致性序列。针对低乘数的数据依然可以保持优秀的准确率,并且无需读取测序时的质量值,也不用一次读取超长序列,可以更加灵活地处理小的数据块。还原关键词：

基因测序;多序列比对;一致性序列;深度学习;强化学习;

专辑：
基础科学
专题：
生物学
DOI：
10.27061/d.cnki.ghgdu.2020.004031
分类号：
Q811.4

导师：

刘贤明;

学科专业：

计算机科学与技术

硕士电子期刊出版信息：

年期：2021年第02期网络出版时间：2021-01-16——2021-02-15

标签：第三代,测序,基因组,学习,序列,一致性
From： https://www.cnblogs.com/wangprince2017/p/17445142.html

第三代DNA测序数据压缩方法研究
第三代DNA测序数据压缩方法研究崔浩翔深圳大学摘要：第三代测序技术自问世以来在临床分子诊断中扮演着越来越重要的角色,尤其在基因组测序、甲基化研究、突变鉴定(SNP检测)等方面。测序技术的不断发展使得测序成本逐年下降,测序数据量急剧增加,如何存储和传输庞大的测序数据是......
基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究
基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究廖小青哈尔滨工业大学摘要：随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP......
基于第三代测序数据的结构变异检测方法研究
基于第三代测序数据的结构变异检测方法研究白若飞北京化工大学摘要：第三代测序技术的飞速发展使人们能够通过少量较长的读段推测个体的完整染色体序列,同时推动了基因变异检测的发展。结构变异的准确检测对人类遗传多样性和临床疾病的研究至关重要。传统研究结构变异的方法是......
面向第三代测序数据的序列比对方法研究
面向第三代测序数据的序列比对方法研究高岩哈尔滨工业大学摘要：随着第三代测序技术的不断发展,第三代测序数据在基因组组装、结构变异检测、全长转录本识别等领域得到了广泛的应用。序列比对作为第三代测序数据分析工作流程中最基础、最关键的步骤,一直都是当今生物信息学领......
一文通吃：从 ZooKeeper 一致性，Leader选举讲到 ZAB 协议与 PAXOS 算法（上）
本文首发自「慕课网」，想了解更多IT干货内容，程序员圈内热闻，欢迎关注"慕课网"或慕课网公众号！作者：大能|慕课网讲师本文将从ZooKeeper集群如何保证一致性，讲到zookeeper保证数据一致性的协议，然后展开讲Zookeeper集群Leader选举，包括集群三种节点的类型，ZAB协议中节点的四种状态，以及两种......
什么是一致性哈希？一致性哈希是如何工作的？如何设计一致性哈希？
如果你有n个缓存服务器，一个常见的负载均衡方式是使用以下的哈希方法：服务器索引=哈希(键)%N，其中N是服务器池的大小。让我们通过一个例子来说明这是如何工作的。如表5-1所示，我们有4台服务器和8个字符串键及其哈希值。为了获取存储某个键的服务器，我们执行模运算f(键)%4......
16 张图解带你掌握一致性哈希算法
https://developer.huawei.com/consumer/cn/forum/topic/0203810951415790238发表于2022-02-2414:258571查看摘要：一致性哈希是什么，使用场景，解决了什么问题？本文分享自华为云社区《16张图解｜一致性哈希算法》，作者：小林coding。如何分配请求？大多数网站背后肯定不是只有......
什么是一致性哈希？一致性哈希是如何工作的？如何设计一致性哈希？
如果你有n个缓存服务器，一个常见的负载均衡方式是使用以下的哈希方法：服务器索引=哈希(键)%N，其中N是服务器池的大小。让我们通过一个例子来说明这是如何工作的。如表5-1所示，我们有4台服务器和8个字符串键及其哈希值。为了获取存储某个键的服务器，我们执行模运算f(键)%......
AI的一致性问题（AI Alignment Problem）
AI的一致性问题 (图片来源：维基百科，Kismetrobot。)人工智慧（AI）系统可以应用到很多方面，帮人类解决很多问题。但不论AI的原始目的是什么，万一AI发展出自己的功能或意识，做出预料之外的事，这可能会造成很多严重的后果，例如在很多电影里面变坏的机器人，试图控制人类的电脑等等。所以如何......
redis专题六：redis 删除策略、淘汰策略、数据库与缓存数据一致性、事物、发布订阅
文章目录一、删除策略二、淘汰策略三、数据库与缓存数据一致性四、redis事务五、redis发布订阅一、删除策略redis使用：惰性删除+定期删除1、定时删除–>以CPU内存换redis内存定时删除过期的缓存值2、惰性删除–>以redis内存换CPU内存查询到该key时如果过期，删除该过期的缓存值......

基于学习的第三代测序一致性序列生成

基于学习的第三代测序一致性序列生成

王水介

哈尔滨工业大学

相关文章

赞助商

阅读排行