首页 > 其他分享 >基于长读的基因组重复序列查找技术研究

基于长读的基因组重复序列查找技术研究

时间:2023-05-31 09:48:12浏览次数:45  
标签:基于 长读 重复 基因组 读数据 查找 序列

基于长读的基因组重复序列查找技术研究

郭睿

深圳大学

摘要:基因组中出现两次或者两次以上基本相同的序列称为重复序列。重复序列信息可以用来可以分析物种的进化,减少基因比对歧义,降低序列拼接数据缺失。与标准重复序列库对比,基于短读序列数据的重复序列查找技术得到的结果并不完整,平均长度较短。长读数据平均长度较长,比短读数据具有更多的信息,可以包含更长、更完整的重复序列。本研究利用长读数据查找重复序列,得到了更长、信息更全的重复序列。研究基于长读数据的重复序列查找技术,主要创新如下:1)提出基于长读数据的查找重复序列技术,得到比基于短读方法更长更完整的重复序列。该方法首先通过比较序列索引的MHAP方法,计算长读数据之间的重叠信息。然后构造重叠网络,其中网络顶点与边分别代表长读信息和重叠长度。之后再利用模块度最优化方法聚类网络节点,得到具有重叠多的读数基团。最后通过分析读数重叠长度的变化,得到基团中代表性读数长度,将其对应的重复序列作为基团代表性重复序列。2)提出RepPeak重复序列查找技术,通过改进RepLong,解决网络基团分辨率的问题,结果具有更好的解释性。该方法先以已有序列或通过Canu拼接长读数据得到的序列作为参考序列。之后分析长读数据与参考序列的比对结果,计算每一个参考序列位点的深度变化,得到深度变化大的位置。再对深度变化位置进行合并和去除操作,从参考序列中抽取对应的序列,即得到重复序列。利用基于长读数据的重复序列查找技术分析果蝇和人类基因数据,可以得到比基于短读技术更长的重复序列,包含了更完整的标准重复序列库信息,弥补了短读数据片段化,包含信息不完全的问题。充分利用了长读读长的优势,不需要拼接读数就可以得到更完整的重复序列。 还原 关键词:

重复序列检测;长读测序技术;网络基团查找;RepLong;RepPeak;

  • 专辑:

    基础科学

  • 专题:

    生物学

  • 分类号:

    Q811.4

导师:

李炎然; 朱泽轩;

学科专业:

计算机科学与技术

硕士电子期刊出版信息:

年期:2019年第07期网络出版时间:2019-06-16——2019-07-15

标签:基于,长读,重复,基因组,读数据,查找,序列
From: https://www.cnblogs.com/wangprince2017/p/17445129.html

相关文章

  • 基于第三代测序数据的基因组结构变异检测方法研究
    基于第三代测序数据的基因组结构变异检测方法研究姜涛哈尔滨工业大学摘要:随着测序技术的不断成熟和广泛应用,以测序技术为驱动的基因组、转录组等多组学的研究得到了跨越式发展,推动了基因组科学、遗传学、临床医学等多学科的变革。基因组变异检测作为基因组研究中最为核心......
  • 基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究
    基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究廖小青哈尔滨工业大学摘要:随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP......
  • linux 中find命令查找到文件仅显示文件名、路径名、完整路径
     001、[root@PC1test3]#lstest1test2[root@PC1test3]#tree##测试数据.├──test1│  └──a.txt└──test2└──b.txt2directories,2files[root@PC1test3]#find./-name"*.txt"##一般显示模式./test1/a.txt......
  • 初级数据结构--插入删除查找表
    插入:头部插入、尾部插入、任意位置插入删除:定位删除查找:值查找、定位查找//定义表typedefstruct{ intdata[MAXSIZE]; intlength;}SqList;//初始化表voidInitSqList(SqList*pl){ inti=0; for(i=0;i<MAXSIZE;i++) pl->data[i]=0; pl->length=0;}//......
  • Unity 对多边形进行矩形分割和查找最大内接矩形
     花了点时间实现了对任意多边形进行矩形分割的功能,有需要的小伙伴可以点这里查看源码 一、实现效果:1、对图片里的内容进行矩形分割     2、对多边形顶点数据进行矩形分割    3、查找图片里内容的最大内接矩形    4、查找多边形顶点数据内的最大内......
  • ABAP 增强查找工具
    *&---------------------------------------------------------------------**&ReportZ_BARRY_FIND_EXIT_BADI*&---------------------------------------------------------------------**&*&---------------------------------------------------......
  • 算法学习-二分查找
    题目:C.PlaceforaSelfieCodeforcesRound862(Div.2)题目链接:Problem-C-Codeforces题目描述: 有若干抛物线(抛物线方程为a*x2+b*x+c,每条抛物线的a,b,c值给出)和经过原点,斜率不同的直线(斜率值k给出)。对于每条抛物线找出任意一条直线,它与该抛物线不相交。题目......
  • find查找指令使用
    #在某个目录下查看含有某个字段的文件find.|xargsgrep"custom"#lldb调试core文件指令:lldb-c/storage/data/core/core_processor.136668.sz-lab-005.1670427164--mainboard-dmodules/planning/dag/planning.dag#当然会想只查看文件,不查看目录find.-typef......
  • 【LeetCode】704.二分查找
    704.二分查找解析:思路一:暴力解法,直接遍历,从头开始查找,如果找到直接返回下标,找不到返回-1。classSolution{public:intsearch(vector<int>&nums,inttarget){for(inti=0;i<nums.size();i++){if(nums[i]==target)......
  • 文件查找和打包压缩命令
    ......