首页 > 其他分享 >PMAT-中文版

PMAT-中文版

时间:2023-11-21 23:34:05浏览次数:26  
标签:组装 assembly -- 中文版 测序 基因组 PMAT

目前已经开发出很多软件应用在植物线粒体基因组的组装,大部分都是针对二代测序数据和三代测序数据ONT及CLR进行组装。受限于二代数据的长度及ONT和CLR测序数据的准确性,对复杂的植物线粒体基因组组装效果并不理想。PMAT可以对WGS的三代测序数据ONT、CLR及HiFi进行组装,并且自动选择线粒体基因组中的序列。该软件目前只能在linux系统运行,github地址 https://github.com/bichangwei/PMAT

PMAT 安装

通过git安装

git clone https://github.com/bichangwei/PMAT.git
cd PMAT/bin
chmod a+x PMAT
PMAT --help

源代码安装

wget https://github.com/bichangwei/PMAT/archive/refs/tags/v1.5.2.tar.gz
tar -zxvf v1.5.2.tar.gz
cd PMAT-1.5.2/bin
chmod a+x PMAT
PMAT --help

Apptainer 安装

需要提前安装Apptainer,具体安装方法可以参考链接

依赖软件

当使用HiFi数据进行组装时,有以下依赖:
  • blastn 需要添加到环境变量中.
对于ONT和crl测序数据,有以下依赖:
  • blastn 需要添加到环境变量中.
  • 如果数据纠错软件指定使用canu,则需要安装canu,否则canuNextDenovo都需要安装(建议添加到环境变量)。

PMAT 使用

Run PMAT --help to view the program's usage guide.

    usage: PMAT <command> <arguments>

     ______     ___           __        ____       _____________ 
    |   __  \  |   \        /   |      / __ \     |_____   _____|
    |  |__)  | | |\ \      / /| |     / /  \ \          | |      
    |   ____/  | | \ \    / / | |    / /____\ \         | |      
    |  |       | |  \ \  / /  | |   / /______\ \        | |      
    |  |       | |   \ \/ /   | |  / /        \ \       | |      
    |__|       |_|    \__/    |_| /_/          \_\      |_|      

    PMAT            an efficient assembly toolkit for plant mitochondrial genome
    Version         1.5.2
    Contributors    Bi,C. and Han,F.
    Email           [email protected], [email protected]

    For more information about PMAT, see https://github.com/bichangwei/PMAT

    optional arguments:
    -h, --help     show this help message and exit
    -v, --version  show program's version number and exit

    Commands:
    
        autoMito    One-step de novo assembly of the mitochondrial genome. 
                    This command corrects the raw ONT/CLR data or uses 
                    the corrected data or HiFi for assembly directly. 
                    Based on the assembly result, automatically select 
                    seeds for extension and filter false positives to 
                    obtain an assembly map of the mitochondrial genome.
    
        graphBuild  If PMAT fails to generate the mitochondrial genome 
                    assembly map in one-step assembly, you can use this 
                    command by manually select seeds for assembly.
  • autoMito 对WGS测序数据(ONT, CLR 和 HiFi)进行从头组装分析

    PMAT autoMito -h 查看程序all的帮助文档

    # 必选参数
    -i --input      #WGS测序数据文件,可以是CLR,ONT 和 HiFi,必须是fasta或者fastq格式或者压缩后的文件
    -o --output     #输出结果路径
    -st --seqtype   #输入数据类型 CLR/clr、ONT/ont、HiFi/hifi
    -g --genomesize #物种基因组大小,例如1G 200M等

    # 可选参数
    -tk --task        #可选任务all/p1,默认为all。如果输入数据为高错误率的原始测序数据需要使用all,如果输入数据为纠错后的数据可以选择p1
    -tp --type        #可选择all/mt/pt,默认为mt。选择进行组装细胞器基因组的类型
    -cp --canu        #canu软件安装路径,如果已经添加到环境变量中则不需要提供该参数,用于前期的测序数据纠错和修剪过程
    -np --nextDenovo  #nextDenovo软件的安装路径,如果已经添加到环境变量中则不需要提供该参数,用于数据的纠错
    -cs --correctsoft #测序数据纠错使用的软件,默认使用nextDenovo,可以选择canu或者NextDenovo
    -cfg --correctcfg #当使用NextDenovo为纠错软件时,需要提供该参数
    -fc --factor      #选择一定比例的子集序列作为组装线粒体基因组的数据集,默认使用全部的测序数据进行组装
    -cpu              #选择使用线程数
  • graphBuild 对组装结果自动检查线粒体基因组序列,并生成gfa文件
    # 必选参数
    -c --ContigGraph    #组装得到的 PMATContigGraph.txt
    -a --AllContigGraph #组装得到的 PMATAllContigs.fna
    -o --output         #输出文件路径
    -gs --genomesize    #物种基因组大小
    -rs --readsize      #组装使用数据量大小
    
    # 可选参数
    -cpu #线程数
    -s --seeds #选择指定的seeds作为候选种子进行延伸,不提供该参数则进行自动选择
应用实例
  1. 下载拟南芥HiFi数据:
wget https://github.com/bichangwei/PMAT/releases/download/v1.1.0/Arabidopsis_thaliana_550Mb.fa.gz
  1. 运行autoMito进行一步组装:
PMAT autoMito -i Arabidopsis_thaliana_550Mb.fa.gz -o ./test1 -st hifi -g 120m -m -tp all
  1. 使用graphBuild手动设置候选contig进行组装:
# Based on the PMATContigGraph.txt file, manually select 3 or more contigs that match the depth of mitochondrial genome sequencing
PMAT graphBuild -c ./test1/assembly_result/PMATContigGraph.txt -a ./test1/assembly_result/PMATAllContigs.fna -gs 125m -rs ./test1/subsample/assembly_seq.cut20K.fasta -o ./test1_gfa -s 343 345 905 513 1344 -tp mt
  1. 运行时间
8 CPUs: 13m25.342s; 16 CPUs: 9m29.853s; 32 CPUs: 8m42.429s; 64 CPUs: 7m57.279s

输出结果:

  • subsample/assembly_seq_subset.0.1.fasta 用于组装的数据
  • subsample/assembly_seq.cut20K.fasta 截断为长度为20kb的reads
  • assembly_result/PMATAllContigs.fna 组装结果contig序列文件
  • assembly_result/PMATContigGraph.txt 组装结果contig连接关系
  • assembly_result/PMAT_mt_raw.gfa 用于可视化的线粒体基因组组装初始结果
  • assembly_result/PMAT_mt_master.gfa 用于可视化的线粒体基因组组装优化结果
  • assembly_result/PMAT_pt_raw.gfa 用于可视化的叶绿体基因组组装初始结果
  • assembly_result/PMAT_pt_master.gfa 用于可视化的叶绿体基因组组装优化结果
更新日志

PMAT version 1.5.0 (23/11/14)
Updates:

  • PMAT添加自动解环功能

PMAT version 1.4.0 (23/11/12)
Updates:

  • PMAT添加可选参数-tp用于组装指定类型的细胞器基因组

PMAT version 1.3.0 (23/9/25)
Updates:

  • 使用apptainer代替singularity,并实现多个任务并行处理

软件已经公布在github(https://github.com/bichangwei/PMAT),期待大家宝贵的建议!

标签:组装,assembly,--,中文版,测序,基因组,PMAT
From: https://www.cnblogs.com/hanfc/p/17847896.html

相关文章

  • Parallels Desktop 12.2.1 (41615) Mac 中文版下载
    软件介绍ParallelsDesktop是一款虚拟化软件,允许你在Mac上创建一台运行Windows和其他操作系统的虚拟机,就好像它们是另一款Mac应用程序一样。与苹果的BootCamp不同,Parallels可以让你同时并行运行Mac和Windows应用程序。这意味着你可以在Mac桌面上浮动的窗口中查看Windows桌面,将Wi......
  • Adobe AfterEffects CC 2021 Mac Intel芯片 中文版
    软件介绍AfterEffects2021是Adobe推出的一款专业非线性视频编辑软件,经常需要编辑视频的人士对这款软件应该都不陌生吧。通过AfterEffects2021可以轻松制作火焰、冰雪、下雨等等视频后期特效,且效果都非常真实酷炫。软件自带丰富的动画资源库,满足用户的使用需求。神秘文件获......
  • Adobe AfterEffects CC 2021 Mac M1芯片 中文版
    软件介绍AfterEffects2021是Adobe推出的一款专业非线性视频编辑软件,经常需要编辑视频的人士对这款软件应该都不陌生吧。通过AfterEffects2021可以轻松制作火焰、冰雪、下雨等等视频后期特效,且效果都非常真实酷炫。软件自带丰富的动画资源库,满足用户的使用需求。神秘文件获......
  • Windows 11 version 23H2 中文版、英文版 (x64、ARM64) 下载 (released Oct 2023)
    Windows11version23H2中文版、英文版(x64、ARM64)下载(releasedOct2023)Windows11,version23H2,2023年10月31日发布请访问原文链接:https://sysin.org/blog/windows-11/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org全新Windows体验,让您与热爱的人......
  • WebStorm下载安装-WebStorm中文版下载 中文版介绍
    WebStorm中文版是一款专业的Web前端编程开发软件。WebStorm最新版拥有JavaScript和JavaScript编译语言,支持智能代码提示和代码结构化,为用户提供了高级编码帮助。WebStorm2021软件拥有更精致的外观,还优化了Vue.js的体验,有效的提高了开发人员的工作效率。软件地址:看置顶贴68.烟柳画桥......
  • Vmware下载安装教程(非常详细) 中文版介绍
    VMwareWorkstation软件特色VMware支持在一台客户机上运行多个操作系统无需安装或者复杂的设置,即可体验预设置的产品的功能和特色VMware虚拟机支持在主机和虚拟机之间共享数据VMware虚拟机支持32位和64位的虚拟机系统支持第三方预设置的虚拟机和镜像文件通过一个直观的主页界面轻松......
  • WebStorm下载-WebStorm官方版下载「电脑版」中文版介绍
    WebStorm简介WebStorm是一个适用于JavaScript和相关技术的集成开发环境。类似于其他JetBrainsIDE,它也会使您的开发体验更有趣,自动执行常规工作并帮助您轻松处理复杂任务。专门针对JavaScript打造是否在为JavaScript开发中最棘手的部分寻找值得信赖的工具10多年来,我们一直......
  • vmware下载_vmware下载+安装教程附安装包 中文版介绍
    vm虚拟机(VMwareWorkstation)是一个“虚拟PC”软件,VMware虚拟机使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与“多启动”系统相比,vm虚拟机采用了完全不同的概念。多启动系统在一个时刻只能运行一个系统,在系统切换时需要重新启动机器。软件地址:看置顶贴41.雨......
  • WebStorm 2020下载_WebStorm 2020官方下载 中文版介绍
    webstorm最新版功能1、支持corepack,这是一个实验性的节点js工具;2、允许您在不安装的情况下使用yarn和pnpm;3、webpack编码帮助将使用webpack.config;4、允许您通过单击命令左侧的run图标直接从文件运行这些命令;5、提供列表创建和下拉菜单,允许您选择标题样式,容易格式化md文件。软件地......
  • PyCharm 2018官方下载 V2018.1中文版 官方版特色
    PyCharm是一款非常不错的PythonIDE编辑器,主要是负责Python集成开发环境(IDE),拥有Python编程人员所需的一切工具和功能,同时还包含有Python、JavaScript、CoffeeScript、TypeScript以及CSS所需的智能化代码编辑器,为Python开发人员提供了广泛的基本工具,它们紧密集成在一起,从而为生产性P......