一、LEfSe分析教程
LEfSe分析(linea discriminant analysis effect size)是一种用于多组物种样本最小判别流程,为微生物组学数据建立分类模型。使用该工具可以明确分析微生物群落的多样性和生态学方面的作用。LEfSe分析可用于发现特定生物标志物和分离基于生物标志物的群体。首先介绍一下LEfSe分析流程。
#安装lefse
pip install numpy scipy matplotlib IPython pandas Sympy nose biopython
#自动化脚本下载并存放于 $HOME/bin 下
curl -o $HOME/bin/lefse https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/lefse/lefse.py
chmod +x lefse
安装及下载LEfSe分析后,我们需要使用终端窗口输入以下命令,打开LEfSe:
python $HOME/bin/lefse-format_input.py input_file output_dir [-h] [-u UNSTRUCTURED] [-f FMT] [-n N] [--min_lf MIN_LF]
二、LEfSe分析结果怎么看
LEfSe分析的结果呈现在网页浏览器上,但可以保存到本地展示。LEfSe分析结果包括主要成分分析(PCA),样本组多级别差异分析(LDA)及其他一些图表。
PCA将样本聚类到空间位置中。LEfSe分析还提供了LDA值,将它们标记为既定组的显着特异性特征。在图表格式中,Lefse Q值代表LEfSe LDA分析结果,如果Lefse Q值高于2则证明它存在显著的区分效果。
三、LEfSe分析全称
LEfSe的全称是“linear discriminant analysis effect size”,是一种专门用于多组物种样本最小分类流程鉴别性分析的工具,为微生物组学数据建立分类模型。只需提供分类信息,LEfSe通过它能够找出分类间最显著度的相关特定物种,更具统计学意义地寻找在分类间显著发生变化的物种。该方法可以用于复杂和高维数据的分组分析,能够让使用者快速了解,准确的识别与不同样本群体相关的菌群差异。
四、LEfSe分析软件
LEfSe分析是一款基于Python语言开发的软件,由地中海食品链生态与生物技术集团(MetaHIT)组开发。相对于其他基于菌落计数数据分析工具, LEfSe具有更好的区分效果和更高的效率。LEfSe分析对生物数据的扩展性和适用性非常高。
五、LEfSe分析的数据格式
LEfSe分析支持不同类型的菌落计数数据,因此用户可以根据样本类型定制数据格式。LEfSe分析所支持菌落数据格式的必需条件是菌落及其相应的注释信息,注释信息充当了分类的作用,提供了比较菌落的基础。数据文件格式随意,可为tsv/csv和xls格式。
#示例数据格式(tsv格式)
#OTU ID B1 B2 B3 B4 B5 B6 类别
OTU1 0 0 0 0 0 12 Type1
OTU2 12 1 0 1 0 2 Type1
OTU3 2 0 1 0 0 5 Type1
OTU4 0 5 9 1 0 2 Type2
OTU5 1 0 6 0 0 5 Type2
OTU6 0 0 2 0 0 2 Type2
OTU7 0 8 7 0 1 0 Type3
OTU8 0 1 0 3 0 0 Type3
六、LEfSe分析怎么念
LEfSe,全称线性判别分析效果量法。Lefse的发音可约束为“Lef-Say”。