KEGG 通路富集分析
KEGG数据库
KEGG(京都基因和基因组百科全书)数据库是日本京都大学生物信息学中心的Kanehisa实验室于1995年建立了的生物信息学数据库。现在是基因组测序和其他高通量实验技术产生的大规模分子数据集的整合和解释的重要生物信息数据参考知识库。KEGG是一个整合了基因组、化学和系统功能信息的数据库。其中最核心的为 KEGG PATHWAY和KEGG ORTHOLOGY 数据库。而在 KEGG PATHWAY 数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems)。
KEGG作为参考知识库,可以用于预测各种细胞过程的蛋白质相互作用网络,整合了当前关于分子相互作用网络的知识,如路径和复合物,以及关于基因组计划产生的基因和蛋白质的信息(GENES / SSDB / KO数据库)和有关生化化合物和反应的信息。因此在生物信息学分析过程中,KEGG通路富集分析常常应用于差异表达基因的功能注释,了解差异表达基因的相关功能与作用通路。
图例
- 横轴表示富集因子,纵轴表示路径。
- 不同的颜色代表不同adjusted p-value,从蓝色到红色,表示adjusted p-value从大到小,富集程度越来越显著。
- 原点的大小代表富集到此通路的基因数目。
参考文献
- Peng T, et al. KEGG pathway enrichment analysis of differentially expressed genes between S28 and S6[J]. PLOS ONE. (2017). https://doi.org/10.1371/journal.pone.0178008.g004.