Functional Analysis
代谢物通路包含了基因、催化酶或代谢物等上下游关系的先验知识,通过将关心的代谢物比对到通路上,再根据如超级几何分析等数学方法计算受影响的代谢物是否能够影响通路。
代谢物富集分析的目的是为了解析某些差异代谢物是否落在某些pathway上(可简单理解为单个差异代谢物解释pathway较弱,同一pathway的代谢物共同解释该通路变化则证据较为robust,在很多生物领域均存在类似的处理逻辑),进而影响pathway的功能。基于pathway可分析代谢物的上下游基因或酶等影响,最终阐明作用机制。
代谢组服务公司反馈回来的代谢组表一般是基于intensity也即是质谱峰强度的数据,需要做前处理方可使用。本次使用直接处理后的数据用于分析。
功能分析方法主流有三类:
-
ORA (Over-Representative analysis):将表达基因ORA放置在通路内,通过超级几何检验判断这些基因是否随机出现在通路内,从而判断功能是否富集
-
GSEA (Gene set enrichment analysis):将所有基因按照log2foldchange的可以排序基因顺序的指标排序,再计算它们出现在每个通路的累积富集分数
-
ssGSEA (single sample Gene set enrichment analysis):将每个样本的基因或代谢物表达值作为输入文件,结合对应通路数据库list,再计算每个通路的每个样本的累积富集分数
注意:代谢组ID也有类似基因ID的多平台多