首页 > 其他分享 >生信教程|最大似然系统发育推断

生信教程|最大似然系统发育推断

时间:2023-09-16 22:33:08浏览次数:37  
标签:似然 最大 系统发育 IQ 模型 TREE 生信

动动发财的小手,点个赞吧!

简介

顾名思义,最大似然系统发育推断旨在找到进化模型的参数,以最大化观察手头数据集的可能性。模型参数包括树的拓扑结构及其分支长度,还包括推理中假设的替代模型(例如HKY或GTR)的所有参数。由于当数据集包含多个类群时,这些参数的搜索空间是巨大的,因此所有用于最大似然系统发育推断的现代程序都应用启发式方法来达到最大似然参数组合。

本教程中,我将介绍最大似然系统发育推断,该程序是为此类分析开发的最快程序之一,即程序 IQ-TREE。我将演示如何通过 bootstrapping 评估系统发育中节点的可靠性,如何将未链接的替换模型应用于单独的分区,以及如何将多个基因的对齐连接起来用于相同的系统发育分析。

IQ-TREE

在本教程的这一部分中,我们将为过滤后的 16S 序列比对生成一个简单的最大似然系统发育。

  • 要了解 IQ-TREE 中可用的许多选项,请查看该程序的长帮助文本:
iqtree --help
  • 向上滚动到 IQ-TREE 帮助文本的开头。接近顶部时,您会发现 IQ-TREE 可以像这样轻松启动:
iqtree -s ALIGNMENT

# 这里,“ALIGNMENT”需要替换为比对的实际文件名。
  • 因此,让我们尝试使用对齐文件 16s_filtered.nex 运行最大似然搜索,首先针对 16S 序列数据:
iqtree -s 16s_filtered.nex


正如您将看到的,这种简约的选项选择实际上似乎已经足够了。 IQ-TREE 应在 10-30 秒内完成分析并显示输出,如下面的屏幕截图所示。

如果您阅读输出的顶部部分,您将看到 IQ-TREE 显然已自动确定您计算机上可用的 CPU 数量,并指示您可以通过指定 -nt AUTO 来使用它们。您还将看到 IQ-TREE 已正确识别序列比对的 Nexus 格式,并且它报告每个序列中缺失数据的比例。

然后,向下滚动一点到此部分:

在这里,您将看到 IQ-TREE 显然已经自动执行了最适合序列比对的替换模型的测试。这意味着 IQ-TREE 的默认设置相当于帮助文本中描述的 -m MFP 选项(扩展模型选择后进行树推理)。或者,可以指定其他替代模型,例如使用 -m GTR,但没有必要这样做; IQ-TREE为我们做模型选择非常方便。

滚动到 IQ-TREE 输出的末尾。在那里,您将找到所选替代模型的参数估计、最大似然值(在“找到的最佳分数”后以对数形式给出)、有关运行时间的信息以及输出文件的名称。写下最大似然值。

  • 根据 IQ-TREE 屏幕输出,最佳得分最大似然树被写入文件 16s_filtered.nex.treefile:

显然,所有输出文件名都是根据输入文件的名称自动选择的。

本文由mdnice多平台发布

标签:似然,最大,系统发育,IQ,模型,TREE,生信
From: https://www.cnblogs.com/swindler/p/17707437.html

相关文章

  • 程序设计之——手把手教你如何从Excel文件中读取学生信息
    在当今信息化时代,计算机技术已经深入到各个领域,而程序设计则成为推动信息化建设的关键技术之一。在众多领域中,学生信息管理系统无疑是其中一个重要的应用。本文将从学生信息管理系统的开发入手,探讨开如何高效且保证质量的完成开发。假设有一个学生信息管理系统,需要从Excel文件中......
  • 程序设计之——手把手教你如何从Excel文件中读取学生信息
    在当今信息化时代,计算机技术已经深入到各个领域,而程序设计则成为推动信息化建设的关键技术之一。在众多领域中,学生信息管理系统无疑是其中一个重要的应用。本文将从学生信息管理系统的开发入手,探讨开如何高效且保证质量的完成开发。假设有一个学生信息管理系统,需要从Excel文件中读......
  • Python实现最大似然估计
    数据部分这个部分,我们使用的是csv数据。下面介绍数据处理的方法。数据读取在Python中,我们可以使用内置的csv模块来读取csv文件。以下是一个简单的例子,演示如何将csv文件读取为多维列表:importcsv#创建一个空列表来存储数据data=[]#使用with语句打开csv文件,这样可以确......
  • 学生信息管理
    #include<stdio.h>int*search(int(*pointer)[5],intn){ int*ptr; ptr=*(pointer+n); return(ptr);}intmain(){ intscore[][5]={(60,70,80,90,87),(57,59,50,56,78),(56,78,56,34,78)}; int*search(int(*pointer)[5],int......
  • 生信工具推荐之(3) perbase
    Per-baseper-nucleotidedepthanalysis统计bam文件每个位置的测序深度、和各种碱基深度、还包括indel,支持多线程。github:https://github.com/sstadick/perbase.gitinstall:condainstall-cbiocondaperbase#ORcargoinstallperbasehelp:perbase0.9.0SethStadic......
  • 学生信息管理系统代码分享 - C语言控制台程序
    【代码要求】   设计与实现学生信息管理系统,实现对学生信息的管理,并且学生的学号是代表该学生信息的唯一性标志。另外学生信息包括:学号、姓名、性别、班级、身份证号、出生日期、联系方式。   该系统具有以下几个功能:   1.系统界面美观、简洁,采用菜单式显示......
  • 学生信息管理系统代码分享 - C语言控制台程序
    【代码要求】   设计与实现学生信息管理系统,实现对学生信息的管理,并且学生的学号是代表该学生信息的唯一性标志。另外学生信息包括:学号、姓名、性别、班级、身份证号、出生日期、联系方式。   该系统具有以下几个功能:   1.系统界面美观、简洁,采用菜单式显示......
  • 生信: 一起读官方文档 GATK2.1版本 篇
    一起读官方文档GATK2.1版本篇参考文章:GATK使用:https://www.plob.org/article/7070.htmlGATK介绍GATK做什么的?它主要用于从sequencing数据中进行variantcalling,包括SNP、INDEL。比如现在风行的exomesequencing找variant,一般通过BWA+GATK的pipeline进行数据分析。BWA......
  • 学生信息登记表单的录入删除代码JS+HTML TOMCAT听课笔记
    <!DOCTYPEhtml><html><head></head><body><formclass="info"autocomplete="off">姓名:<inputtype="text"class="uname"name="uname"&......
  • 生信:RNA-Seq 比对工具性能比较 [STAR、Tophat2、HISAT2]
    RNA-Seq比对工具性能比较参考文章:https://yanzhongsino.github.io/2021/11/19/omics_transcriptome.RNA-seq/https://www.biostars.org/p/288726/比对(align)介绍序列比对又称为alignRNA-Seq分析中的策略从文件类型来看如下:graphLRFASTQ文件----->SAM文件-----......