LEfSe分析用法介绍(如何进行LEfSe分析)

一、LEfSe分析教程

LEfSe分析(linea discriminant analysis effect size)是一种用于多组物种样本最小判别流程,为微生物组学数据建立分类模型。使用该工具可以明确分析微生物群落的多样性和生态学方面的作用。LEfSe分析可用于发现特定生物标志物和分离基于生物标志物的群体。首先介绍一下LEfSe分析流程。


#安装lefse
pip install numpy scipy matplotlib IPython pandas Sympy nose biopython

#自动化脚本下载并存放于 $HOME/bin 下
curl -o $HOME/bin/lefse https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/lefse/lefse.py
chmod +x lefse

安装及下载LEfSe分析后,我们需要使用终端窗口输入以下命令,打开LEfSe:


python $HOME/bin/lefse-format_input.py input_file output_dir [-h] [-u UNSTRUCTURED] [-f FMT] [-n N] [--min_lf MIN_LF]

二、LEfSe分析结果怎么看

LEfSe分析的结果呈现在网页浏览器上,但可以保存到本地展示。LEfSe分析结果包括主要成分分析(PCA),样本组多级别差异分析(LDA)及其他一些图表。

PCA将样本聚类到空间位置中。LEfSe分析还提供了LDA值,将它们标记为既定组的显着特异性特征。在图表格式中,Lefse Q值代表LEfSe LDA分析结果,如果Lefse Q值高于2则证明它存在显著的区分效果。

三、LEfSe分析全称

LEfSe的全称是“linear discriminant analysis effect size”,是一种专门用于多组物种样本最小分类流程鉴别性分析的工具,为微生物组学数据建立分类模型。只需提供分类信息,LEfSe通过它能够找出分类间最显著度的相关特定物种,更具统计学意义地寻找在分类间显著发生变化的物种。该方法可以用于复杂和高维数据的分组分析,能够让使用者快速了解,准确的识别与不同样本群体相关的菌群差异。

四、LEfSe分析软件

LEfSe分析是一款基于Python语言开发的软件,由地中海食品链生态与生物技术集团(MetaHIT)组开发。相对于其他基于菌落计数数据分析工具, LEfSe具有更好的区分效果和更高的效率。LEfSe分析对生物数据的扩展性和适用性非常高。

五、LEfSe分析的数据格式

LEfSe分析支持不同类型的菌落计数数据,因此用户可以根据样本类型定制数据格式。LEfSe分析所支持菌落数据格式的必需条件是菌落及其相应的注释信息,注释信息充当了分类的作用,提供了比较菌落的基础。数据文件格式随意,可为tsv/csv和xls格式。


#示例数据格式(tsv格式)
#OTU ID      B1  B2  B3  B4  B5  B6  类别
OTU1        0   0   0   0   0   12  Type1
OTU2        12  1   0   1   0   2   Type1
OTU3        2   0   1   0   0   5   Type1
OTU4        0   5   9   1   0   2   Type2
OTU5        1   0   6   0   0   5   Type2
OTU6        0   0   2   0   0   2   Type2
OTU7        0   8   7   0   1   0   Type3
OTU8        0   1   0   3   0   0   Type3

六、LEfSe分析怎么念

LEfSe,全称线性判别分析效果量法。Lefse的发音可约束为“Lef-Say”。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平