首页 > 其他分享 >Hap-Eval:Sentieon团队开发的开源结构变异SV准确率评估工具

Hap-Eval:Sentieon团队开发的开源结构变异SV准确率评估工具

时间:2023-01-06 14:45:36浏览次数:63  
标签:eval VCF -- SV INT Eval Hap Sentieon

Sentieon开发的Hap-eval准确率评估工具在设计之初就考虑到了复杂以及重复的基因组区域,采用了基于单倍型拼接序列的矩阵比较模式,兼容包括PacBio和ONT在内的主流三代长读长测序数据。另外值得一提的是,Hap-eval基于python所写,运行效率非常高,速度快,非常适用于大规模分析场景。

开源地址:

https://github.com/Sentieon/hap-eval

工具介绍:

Sentieon的研发团队开发了SV评估软件 Hap-eval。Hap-eval基于单倍型 (haplotype) 对两组SV结果进行比较,首先会将比较区块内的SV拼接成单倍型序列,如果SV的结果中有定相信息,在这一步也可以被利用;然后这些单倍型序列被用来建立一个矩阵,进行结果判断。

 

 安装方法:

git clone --recurse-submodules https://github.com/Sentieon/hap-eval.git
pip install ./hap-eval

使用方法:

usage: hap_eval [-h] -r FASTA -b VCF -c VCF [-i BED] [-t INT] [--base_out VCF]
                [--comp_out VCF] [--maxdist INT] [--minsize INT]
                [--maxdiff FLOAT] [--metric STR]

optional arguments:
  -h, --help            show this help message and exit
  -r FASTA, --reference FASTA
                        Reference file
  -b VCF, --base VCF    Baseline vcf file
  -c VCF, --comp VCF    Comparison vcf file
  -i BED, --interval BED
                        Evaluation region file
  -t INT, --thread_count INT
                        Number of threads
  --base_out VCF        Annotated baseline vcf file
  --comp_out VCF        Annotated comparison vcf file
  --maxdist INT         Maximum distance to cluster variants (default: 1000)
  --minsize INT         Minimum size of variants to consider (default: 50)
  --maxdiff FLOAT       Haplotype difference theshold (default: 0.2)
  --metric STR          Distance metric (default: Levenshtein)


Hap-Eval 是一款新发布软件,功能在持续完善开发中。如果 遇到不能Hap-Eval不能适配的 VCF文件,可通过github或[email protected]及时反馈。

标签:eval,VCF,--,SV,INT,Eval,Hap,Sentieon
From: https://www.cnblogs.com/insvast/p/17030191.html

相关文章

  • 实现简单的csv文件上传和bootstrap表格的下载
    一、写一个简单的页面并发送文件引入bootstrap.js,jQuery.js等,具体的网页就不细写了,很简单。加入input框,button控件,进度条。如下:<liclass="list-group-item"......
  • windows,linux下SVN实现自动更新WEB目录
    通过SVN进行版本库管理,每次提交后,都要在SVN服务器更新最新上传的版本到WEB目录进行同步。操作比较烦琐,而且效率也低。使用SVN钩子脚本进行WEB目录同步,可很好的解决这方面的......
  • R语言随机波动模型SV:马尔可夫蒙特卡罗法MCMC、正则化广义矩估计和准最大似然估计上证
    全文链接:http://tecdat.cn/?p=31162最近我们被客户要求撰写关于SV模型的研究报告,包括一些图形和统计输出。本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计......
  • 一步一步学爬虫(4)数据存储之CSV文件存储
    (一步一步学爬虫(4)数据存储之CSV文件存储)4.3CSV文件存储CSV,全称Comma-SeparatedValues,中文叫做逗号分隔值或字符分隔值,其文件以纯文本形式存储表格数据。CSV文件是一个......
  • svg 贝塞尔曲线画法
     svg贝塞尔曲线画法https://cubic-bezier.com/#.48,.46,.38,.8 <animateattributeName="x"dur="5s"values="0;80;160"keyTimes="0;.8;1"calcMode="spline......
  • SVN服务器搭建和使用(二)
     上一篇介绍了VisualSVNServer和TortoiseSVN的下载,安装,汉化.这篇介绍一下如何使用VisualSVNServer建立版本库,以及TortoiseSVN的使用.首先打开VisualSVNServerManage......
  • Python开发一个csv比较功能相关知识点汇总及demo
    Python2.7csv.reader(csvfile, dialect='excel', **fmtparams)的一个坑:csvfile被csv.reader生成的iterator,在遍历每二次时,内容为空iteratorAnobjectrepresentingastr......
  • svn 操作
     svn文档http://www.mamicode.com/info-detail-2206012.html安装配置SVNfirewall-cmd--add-port=3690/tcp--permanent防火墙添加3690端口firewall-cmd--rel......
  • CSV:简单格式下隐藏的那些坑
    摘要:本文将盘点处理CSV数据时我遇到的一些坑。本文分享自华为云社区《CSV—简单格式下隐藏的那些坑》,作者:aKi。前言CSV(Comma-SeparatedValues),是一种通用的、相对简单的......
  • tomcat添加TLSv1.2https证书访问
    打开conf下的 server.xml,从中找到如下注释信息。<!--DefineaSSL/TLSHTTP/1.1Connectoronport8443ThisconnectorusestheNIOimplementation.Thedefault......