首页 > 编程语言 >Kraken序列分类算法

Kraken序列分类算法

时间:2023-04-19 20:23:33浏览次数:32  
标签:Kraken 分类 kraken 算法 mer 序列 id

当然可以!kraken是一种流行的高效序列分类器,使用 k-mer (k个连续碱基组成的子串)方法对不同分类下的序列进行分类。以下是kraken序列分类算法简要说明:

  1. 数据预处理

首先,kraken会将参考数据库中的序列分割为固定长度的 k-mers,这些k-mer会被记录到一个查询表中。

  1. 样品序列匹配

kraken通过比对来自样品的短读序列(通常为32bp或更少,可以根据实验需要调整),与查询表中的 k-mer 匹配,并记录经过匹配的 k-mer。

  1. 计算lca(最近公共祖先)

lca计算是kraken算法的核心。这一步骤主要涉及的约简数据结构是ncbi(美国国家生物技术信息中心)的 taxonomic 树。每一个 k-mer之前必须对应着一个分类学意义上正确的taxon id(id大致相当于生命体系中的等级,例如物种、属、门等)。由于在参考数据库中存在不同分类间交叉的 k-mers,所以每个 k-mer必须被指派到唯一的位置(也就是唯一的taxon id)。

  1. 输出分类结果

统计经过搜索和分类的k-mer的数量,并利用分类后的k-mer信息支持对样品的分类结果。这些结果可以轻松地导出到一个表格中,以便进行后续分析。

总之,kraken是一款高效、准确和灵活的序列分类器,适用于大规模的医学、生物学和生态学应用。

标签:Kraken,分类,kraken,算法,mer,序列,id
From: https://www.cnblogs.com/wzbzk/p/17334495.html

相关文章

  • java -- 缓冲流、转换流、序列化流
    缓冲流缓冲流,也叫高效流,按照数据类型分类:字节缓冲流:BufferedInputStream,BufferedOutputStream字符缓冲流:BufferedReader,BufferedWriter缓冲流的基本原理,是在创建流对象时,会创建一个内置的默认大小的缓冲区数组,通过缓冲区读写,减少系统IO次数,从而提高读写的效率。字节缓......
  • 替换算法与写策略
    一.基础认知1.个人理解替换算法是用于管理高速缓存(Cache)中数据的一种策略,当高速缓存已满并需要为新的数据腾出空间时,替换算法会决定哪些数据应该被从高速缓存中替换出去。2.基础认知首先,我们需要知道计算机的组成原理,在其中计算机可以划分为cache-主存和主存-辅存两种层级结构......
  • javasec(四)序列化与反序列化基本原理
    title:javasec(四)序列化与反序列化基本原理tags:-javasec-反序列化categories:-javaseccover:'https://blog-1313934826.cos.ap-chengdu.myqcloud.com/blog-images/1.jpeg'feature:falsedate:2023-04-1816:02:20这篇文章介绍java序列化与反序列化基本原......
  • javasec(五)URLDNS反序列化分析
    这篇文章介绍URLDNS就是ysoserial中⼀个利⽤链的名字,但准确来说,这个其实不能称作“利⽤链”。因为其参数不是⼀个可以“利⽤”的命令,⽽仅为⼀个URL,其能触发的结果也不是命令执⾏,⽽是⼀次DNS请求。ysoserial打包成jar命令mvncleanpackage-DskipTests,刚刚入门所以用这条链作......
  • python反序列化
    这篇文章介绍python反序列化。0X00前言本篇文章搬运大佬k0rz3n的研究文章,写的特别好,存下来学习一下。0X01Python的序列化和反序列化是什么Python的序列化和反序列化是将一个类对象向字节流转化从而进行存储和传输,然后使用的时候再将字节流转化回原始的对象的一个过程。1.......
  • 一个使用公式化序列分类的EAL学术写作辅助环境
    一个使用公式化序列分类的EAL学术写作辅助环境(AnassistiveenvironmentforEALacademicwritingusingformulaicsequencesclassification)★★实验结果实验组、对照组和两维度分析:对照组学生:使用短语库;实验组学生:使用提出的应用程序(ARP)作为辅助工具。  一、摘要......
  • 数据结构与算法学习01
    学习要点一、预习页码:2-27二、预习内容1、数据结构基本定义:数据、数据元素、数据项、数据对象,重点理解数据结构的定义。2、理解逻辑结构。集合、线性结构、树形结构、图形结构。数学描述方法。3、理解存储结构。顺序存储结构、链式存储结构、索引存储结构和哈希存储结构。4......
  • 数据结构与算法学习02
    学习要点一、复习内容重点及难点:算法的时间复杂度分析。过程:(1)找寻循环中的最内层语句(2)分析该语句的执行次数。二、预习内容1、预习页码:21-22,30,32-422、具体预习内容(1)算法的平均时间复杂度分析。不能用最好和最坏的极端情况分析算法,应该用等概率的平均时间复杂度来进行分析......
  • 数据结构与算法学习04
    学习要点1、预习页码:47-542、预习内容:(1)单链表建立的头插法和尾插法。(重点)两种方法的不同级效果。(2)线性表的基本运算在单链表中的实现。(9个算法)重点掌握在9个算法中,如何计算单链表的长度(采用循环计数的方式),单链表越界的描述,单链表中节点的查找,单链表节点的插入和删除操作。(重点......
  • 数据结构与算法学习03
    学习要点一、预习页码:38-51二、预习内容1、顺序表应用实例——P38---例题2.3+例题2.4,练习题P71---6。2、线性表的实现——单链表(必须掌握),构造过程,见P43-图2.113、单链表的定义,见P44--最后四行4、熟练掌握单链表的插入删除操作。(重点掌握)——图2.14+图2.155、(重点掌握)单链表......