首页 > 其他分享 >Jellyfish: 快速统计长序列中每个K-mers出现次数

Jellyfish: 快速统计长序列中每个K-mers出现次数

时间:2023-04-15 09:12:11浏览次数:31  
标签:mers 序列 Jellyfish 快速 统计 jellyfish

 

 

Jellyfish: 快速统计长序列中每个K-mers出现次数

   

一个老工具,2011 发表于Bioinformatics,目前引用1018次。因为需要用所以看了一下原文。

Jellyfish,是此研究开发的,可以快速统计长序列中每个K-mers出现次数的软件。

基于K-mers的应用很广,包括基因组组装、测序读长的错误纠正、快速多序列比对、重复检测、引物设计等等。

因此对K-mers的高效统计对提高效率十分重要。

Jellyfish可并行运算,快速的统计不超过长度31个碱基的K-mers。软件基于C++,下载地址为:

http://www.cbcb.umd.edu/software/jellyfish

总的来说,Jellyfish相较之前的软件占用内存低一个数量级,而速度则高一个数量级。

目前Jellyfish已经更新到了2.0版本,最近一次更新是2015年更新到Jellyfish 2.2.3。2.0版本最大的优化是不再限制K-mers的长度。

下载及使用见:

http://www.genome.umd.edu/jellyfish.html#Release

Github上也有说明文档:

https://github.com/gmarcais/Jellyfish/tree/develop/swig

目前jellyfish也已经被写入到了Python, Ruby和Perl中。

—END—

标签:mers,序列,Jellyfish,快速,统计,jellyfish
From: https://www.cnblogs.com/xiaojikuaipao/p/17320493.html

相关文章

  • 二分法查找子序列
    判断子序列二分思路主要是对t进行预处理,用一个字典index将每个字符出现的索引位置按顺序存储下来intm=s.length(),n=t.length();vector<vector<int>>index(256,vector<int>());//先记下t中每个字符出现的位置for(inti=0;i<n;i++){charc=t[i];......
  • fastjson 1.2.24 反序列化漏洞(审计分析)
    环境JDK8u181Fastjson1.2.24POC跟进parse方法跟进到底层deserialze方法Poc中传入的dataSourceName:ldap://192.168.3.229:8084/vnSYPYwMs值这里实际对应setDataSourceName方法,调用此方法并传入ldap跟进setDataSourceName方法,这里只是简单赋值 步出......
  • 用 Go 剑指 Offer 31. 栈的压入、弹出序列 (辅助栈)
    输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如,序列{1,2,3,4,5}是某栈的压栈序列,序列{4,5,3,2,1}是该压栈序列对应的一个弹出序列,但{4,3,5,1,2}就不可能是该压栈序列的弹出序列。示例1:输入:pushe......
  • oracel将序列值改为当前系统最大值方法
    --修改序列为表中最大值declareMax_IdNUMBER(10);Current_ValueNUMBER(10);BEGINSELECTmax(to_number(user_code))INTOMax_IdFROMF_USERINFOtwheret.user_code!='u0000000';loopSELECTS_USERCODE.NEXTVALINTOCurrent_ValueFROMdual;......
  • 动态规划04——300. 最长递增子序列
    300.最长递增子序列给你一个整数数组nums,找到其中最长严格递增子序列的长度。子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7]是数组[0,3,1,6,2,2,7]的子序列。示例1:输入:nums=[10,9,2,5,3,7,101,18]输出:4解释:最长递......
  • 序列话ID的作用
    1、序列化ID的作用其实,这个序列化ID起着关键的作用,它决定着是否能够成功反序列化!简单来说,Java的序列化机制是通过在运行时判断类的serialVersionUID来验证版本一致性的。在进行反序列化时,JVM会把传来的字节流中的serialVersionUID与本地实体类中的serialVersionUID进行比......
  • java.io.Serializable(序列化)接口
     一、概念Java对象序列化的意思就是将对象的状态转化成字节流,以后可以通过这些值再生成相同状态的对象。对象序列化是对象持久化的一种实现方法,它是将对象的属性和方法转化为一种序列化的形式用于存储和传输。反序列化就是根据这些保存的信息重建对象的过程。序......
  • C# Json序列化,设置驼峰命名(字段首字母小写)
    相关代码:varserializerSettings=newJsonSerializerSettings{//设置为驼峰命名ContractResolver=newCamelCasePropertyNamesContractResolver()};varresult=JsonConvert.Ser......
  • Oracle创建序列
    创建序列语法:CREATESEQUENCE序列名;--示例createsequenceSEQ_CX_TEXT_SEQ;----CreatesequencecreatesequenceSEQ_CX_TEXT_SEQminvalue1maxvalue9999999999999999999999999999startwith1incrementby1cache20;--如果指定cache,oracle预先在内存中放置......
  • numpy.linspace-返回均匀间隔的数字序列
    语法格式numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)常用参数解释:start:序列的起始值stop:序列的终止值num:要生成的样本数量。默认值是50。必须是非负的endpoint:如果是True,最后一个值取到stop值。否则,不包括它。......