IQ-TREE:基于最大似然的进化树构建软件(TREE的使用)

IQ-TREE是一种新型的基于最大似然(ML)思想的系统进化树构建软件,具有高准确度,并可提供多种可选模型选择。在生物信息学领域,建立进化树是重要的任务之一,是研究种系发生学、基因演化、分类学等研究领域的基础。IQ-TREE在这些领域都有广泛的应用,并且在速度、准确性和软件易用性方面领先其他软件,因此也逐渐成为当前进化树构建领域的主流软件之一。

一、简单易用的操作界面

IQ-TREE从操作界面的设计角度考虑,简单易用、直观友好,能够满足不同用户的需求,包括常规用户和高级用户等。举例来说,在IQ-TREE的操作界面中,有五个主要标签页可以选择使用,分别为Input、Model、Partition、Algorithm和Run等。

Input标签页可用于导入数据集,相应的数据集可以是FASTA格式的多重比对文件,也可以是新发现的序列等。在Model标签页中,可以选择构建进化树时选择的模型,不同的模型将会影响结果的准确性,因此可以根据实际需要进行选择。

Partition标签页则提供了对序列基因分区的参数设置。用户可以通过手工选择或者使用选项来进行分区配置,从而精确指定进化树分档的位置。在Algorithm标签页中,可选择ML或贝叶斯分析等不同的进化树构建算法,并根据需要进行参数设置。最后,在Run标签页中,可以对进化树的模型、分区、算法等进行全面设置,从而得到理想的处理结果。

二、多种模型选择

IQ-TREE中提供了多种可选的模型选择,除了常用的高斯模型和四分之一模型以外,还可以运用冯 氏 模型、未受初始化的fisher和K80/JC模型等多种模型。用户可以根据需要任意选择。例如,如果数据集主要是有大量不同高度分叉分叉的菌株序列构成,那么基于斯普林金模型进行比较更适合于算法网络。

在IQ-TREE中,模型分级按照两个维度排列,一是复杂度的不同,二是类型的不同。以DNA模型为例,其中提供了一系列常用的模型,包括一些复杂度较低的GTR、Hasegawa-Kishino-Yano模型,也有一些类型不同、复杂度较高的模型,例如分段、多分形态等不同模型。通过选择不同的模型,可以对数据进行精确的比较,从而有助于进化树构建结果的准确性。

三、快速结果输出

IQ-TREE的程序经过优化,可以在短时间内进行高精度的进化树构建。同时,IQ-TREE还可以进行多核加速,加速求解进化树构建问题,提高处理速度。另外,IQ-TREE的输出结果可以借助多种格式输出,例如Newick格式、nexus格式、图像格式等,方便数据交换和对照处理。

在进行进化树构建的过程中,可以输出一些实用的辅助功能,例如计算LH、参数符号测试等,从而有助于进一步分析数据。同时,在输出结果中,还提供了树形态图和树分支长度图等可视化结果,为用户提供细节的呈现。

四、多平台支持

IQ-TREE支持主流的多种操作系统,包括Windows、OS X、Linux等不同平台。用户只需要根据自己的操作系统版本,下载并安装IQ-TREE程序,即可进行方便的使用。

五、代码示例

安装IQ-TREE

conda install iqtree

运行IQ-TREE

 iqtree -s alignment.phy -m JC -bb 1000 -alrt 1000 -nt AUTO 

-s后面是多序列比对文件的路径,-m后面是核苷酸模型的名称,-bb后面是bootstrap值的数量,-alrt是SH-aLRT相关性的数量,-nt为进程数,自动调整。执行后程序将在当前目录中生成一个名为alignment.result的文件.

结语

IQ-TREE是基于最大似然的进化树构建软件,具有高准确度和多种模型选择等特点。它可以快速求解进化树构建问题,提高数据分析效率,并方便生成多种格式的结果,方便数据交换和对照处理。通过IQ-TREE的运用,可以为进化树构建和生物信息学领域研究方面提供强大的支持。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平