MDR的进阶版本-GMDR

欢迎关注”生信修炼手册”!

MDR多因子降维法作为逻辑回归的一种补充，有效克服了逻辑回归在处理高阶稀疏数据时的局限性，广泛应用于分析基因-基因，基因-环境之间的相互作用，但是该方法存在一些局限性

和逻辑回归一样，该方法仅适用于二分类因变量的分析，比如case/control的实验设计，对于连续型因变量无法处理
和逻辑回归不同，逻辑回归可以进行协变量的校正，而该方法不可以

为了克服上述两个问题，增加MDR方法的适用性，科学家们在MDR核心思想的基础上进行了扩展，引入了score statistic的概念，提出了GMDR的方法，原理示意如下

MDR算法的核心是统计不同因子组合对应的频数，对应第三步中的单元格内的频数，然后用该频数的比值进行降维，并进行分类准确性和预测错误率的分析，从而挑选佳的模型。

GMDR仍然沿用了相同的算法框架，只不过将频数改为了打分，关于其打分系统的详细介绍参见下面这篇文章

https://www.cell.com/action/showPdf?pii=S0002-9297(07)61030-161030-1)

然后根据该打分值来进行后续的降维，分类准确性，预测错误率等分析。在文章中也比较了MDR和GMDR的分析结果，结果如下

可以看到，MDR和GMDR结果的一致性非常高，而同样的因子组合，GMDR的预测准确率和交叉验证的一致率都比MDR方法好。GMDR支持广义线性回归等多种模型，图示如下

可以用于处理各种类型的数据，软件下载的网址如下

http://www.ssg.uab.edu/gmdr/

和MDR软件的用法完全一致，导入文件即可。至少要求输入SNP位点的分型结果文件，内容如下

如果需要进行协变量的校正，也可以输入对应的文件，内容如下

每一行对应的都是一个样本，分型结果和协变量两个文件中每一行对应同一个样本，最后一列为因变量y。导入文件后，点击Run Analysis即可开始分析，分析结果如下所示

和MDR输出结果类似，也是有两个部分，第一部分显示了不同数量的因子相互作用中最显著的结果, Training Bal.Acc表示训练集中的准确率，Testing Bal.Acc表示测试集中的准确率，数字越大，范围为0-1，数值越大，准确率越高，CV Consistency表示交叉验证的一致率，8/10表示10次交叉验证中8次该结果都显著。Sign Test(p)表示p值；第二部分则显示了对应的score值等详细信息。

该软件也可以通过命令行运行，更多用法请参考官方文档。

·end·

—如果喜欢，快分享给你的朋友们吧—

往期精彩

自己动手进行逻辑回归，你也可以！
GWAS大家都知道，Gene-Based GWAS你了解吗？
3步搞定GWAS中的Gene Set Analysis
你听说过Epistasis吗？
GWAS中的Gene-Gene Interactions如何分析？看这里
终于搞清楚了Lasso回归和Ridge回归的区别
odd ratio置信区间的计算，你学会了吗？
多元回归分析存在多重共线性了怎么办？
基因型与表型的交互作用如何分析，多元回归来搞定
曼哈顿图就够了吗?你还需要LocusZoom
GWAS做完了，下一步做什么？

GWAS meta分析

GWAS样本量不够怎么办，meta分析了解一下
你没看错，搞定GWAS meta分析只需一行代码！
meta分析的森林图不会画？看这里
GWAMA:GWAS meta-analysis的又一利器
点击鼠标即可完成GWAS meta分析，任何人都可以！
用R进行gwas meta分析,原来如此简单

基因型填充

GWAS中的genotype imputation简介
基因型填充中的phasing究竟是什么
基因型填充前的质控条件简介
使用shapeit进行单倍型分析
gtool:操作genotype data的利器
使用IMPUTE2进行基因型填充
使用Beagle进行基因型填充
使用Minimac进行基因型填充
使用Eagle2进行单倍型分析
X染色体的基因型填充
文献解读|不同基因型填充软件性能的比较
Haplotype Reference Consortium:最大规模的单倍型数据库
Michigan Imputation Server:基因型填充的在线工具

CNV分析

aCGH芯片简介
aCGH芯片分析简介
基于SNP芯片进行CNV分析中的基本知识点
PennCNV:利用SNP芯片检测CNV
DGV:人类基因组结构变异数据库
dbvar:染色体结构变异数据库
DGVa:染色体结构变异数据库
CNVD:疾病相关的CNV数据库
DECIPHER:疾病相关的CNV数据库
全基因组数据CNV分析简介
使用CNVnator进行CNV检测
使用lumpy进行CNV检测
CNVnator原理简介
WES的CNV分析简介
XHMM分析原理简介
使用conifer进行WES的CNV分析
使用EXCAVATOR2检测WES的CNV
靶向测序的CNV分析简介
使用CNVkit进行CNV分析
DECoN:最高分辨率的CNV检测工具

TCGA

TCGA数据库简介
使用GDC在线查看TCGA数据
使用gdc-client批量下载TCGA数据
一文搞懂TCGA中的分析结果如何来
通过GDC Legacy Archive下载TCGA原始数据
使用GDC API查看和下载TCGA的数据
使用GDC下载TCGA肿瘤患者的临床信息
使用TCGAbiolinks下载TCGA的数据
使用TCGAbiolinks进行生存分析
使用TCGAbiolinks分析TCGA中的表达谱数据
使用TCGAbiolinks进行甲基化和转录组数据的联合分析
Broad GDAC:TCGA数据分析中心
使用cBioPortal查看TCGA肿瘤数据
UCSC Xena:癌症基因组学数据分析平台
GEPIA:TCGA和GTEx表达谱数据分析平台
TANRIC:肿瘤相关lncRNA数据库
SurvNet:基于网络的肿瘤biomarker基因查找算法
TCPA:肿瘤RPPA蛋白芯片数据中心
TCGA Copy Number Portal:肿瘤拷贝数变异数据中心

生存分析

生存分析详细解读
用R语言进行KM生存分析
使用OncoLnc进行TCGA生存分析
用R语言进行Cox回归生存分析
使用kmplot在线进行生存分析

肿瘤数据库

ICGC:国际肿瘤基因组协会简介
HPA:人类蛋白图谱数据库
Oncomine:肿瘤芯片数据库
ONGene:基于文献检索的肿瘤基因数据库
oncomirdb:肿瘤相关的miRNA数据库
TSGene:肿瘤抑癌基因数据库
NCG:肿瘤驱动基因数据库
mutagene:肿瘤突变频谱数据库
CCLE:肿瘤细胞系百科全书
mSignatureDB:肿瘤突变特征数据库
GTEx:基因型和基因表达量关联数据库

肿瘤免疫和新抗原

Cancer-Immunity Cycle:肿瘤免疫循环简介
TMB:肿瘤突变负荷简介
肿瘤微环境:Tumor microenvironment (TME)简介
肿瘤浸润免疫细胞量化分析简介
使用EPIC预测肿瘤微环境中免疫细胞构成
TIMER:肿瘤浸润免疫细胞分析的综合网站
quanTIseq:肿瘤浸润免疫细胞定量分析
The Cancer Immunome Atlas:肿瘤免疫图谱数据库
肿瘤新抗原简介
TSNAdb:肿瘤新抗原数据库
使用NetMHCpan进行肿瘤新抗原预测分析

Hi-C数据分析

chromosome-territories:染色质疆域简介
chromosome conformation capture:染色质构象捕获技术
3C的衍生技术简介
解密Hi-C数据分析中的分辨率
A/B compartment:染色质区室简介
TAD:拓扑关联结构域简介
chromatin loops:染色质环简介
Promoter Capture Hi-C:研究启动子区染色质互作的利器
使用HiCUP进行Hi-C数据预处理
Juicer:Hi-C数据处理分析的利器
Juicer软件的安装详解
Juicebox:Hi-C数据可视化利器
Juicer实战详解
HiC-Pro:灵活的Hi-C数据处理软件
HiC-Pro实战详解
3D Genome Browser:Hi-C数据可视化工具
HiCPlotter:Hi-C数据可视化工具
3CDB:基于3C技术的染色质互作信息数据库
3DIV:染色质空间互作数据库
4DGenome:染色质相互作用数据库
4D nucleome project:染色质三维结构研究必不可少的参考项目
3dsnp:SNP在染色质环介导的调控网络中的分布数据库
iRegNet3D:疾病相关SNP位点在三维调控网络中的作用
使用WashU Epigenome Browser可视化hi-c数据
HiGlass:高度定制的Hi-C数据可视化应用
Hi-C Data Browser:Hi-C数据浏览器
使用FitHiC评估染色质交互作用的显著性
使用TADbit识别拓扑关联结构域
使用pyGenomeTracks可视化hi-c数据
hi-c辅助基因组组装简介
文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装

chip_seq数据分析

Chip-seq简介
chip_seq质量评估之计算样本间的相关性
chip_seq质量评估之查看抗体富集效果
chip_seq质量评估之PCA分析
chip_seq质量评估之coverage分析
chip_seq质量评估之FRiP Score
chip_seq质量评估之cross correlation
chip_seq质量评估之文库复杂度
depth, bedgraph, bigwig之间的联系与区别
bigwig归一化方式详解
使用igvtools可视化测序深度分布
使用UCSC基因组浏览器可视化测序深度分布数据
使用deeptools查看reads分布特征
使用phantompeakqualtools进行cross correlation分析
blacklist regions:NGS测序数据中的黑名单
MACS:使用最广泛的peak calling软件之一
MACS2 peak calling实战
使用SICER进行peak calling
使用HOMER进行peak calling
peak注释信息揭秘
PAVIS:对peak区域进行基因注释的在线工具
使用UPORA对peak进行注释
使用GREAT对peak进行功能注释
annoPeakR:一个peak注释的在线工具
使用ChIPpeakAnno进行peak注释
使用ChIPseeker进行peak注释
使用PeakAnalyzer进行peak注释
使用homer进行peak注释
利用bedtools预测chip_seq数据的靶基因

motif

关于motif你需要知道的事
详解motif的PFM矩阵
详解motif的PWM矩阵
使用WebLogo可视化motif
使用seqLogo可视化motif
使用ggseqlogo可视化motif
MEME:motif分析的综合性工具
使用MEME挖掘序列中的de novo motif
使用DREME挖掘序列中的de novo motif
使用MEME-ChIP挖掘序列中的de novo motif

chip_seq数据库

ENCODE project项目简介
FactorBook:人和小鼠转录因子chip_seq数据库
ReMap:人类Chip-seq数据大全
IHEC:国际人类表观基因组学联盟
Epifactors:表观因子数据库
GTRD:最全面的人和小鼠转录因子chip_seq数据库
ChIP-Atlas:基于公共chip_seq数据进行分析挖掘
Cistrome DB:人和小鼠的chip_seq数据库
chipBase:转录因子调控网络数据
unibind:human转录因子结合位点数据库
chip_seq在增强子研究中的应用
DENdb:human增强子数据库
VISTA:人和小鼠的增强子数据库
EnhancerAtlas:人和小鼠的增强子数据库
FANTOM5:人类增强子数据库
TiED:人类组织特异性增强子数据库
HEDD:增强子疾病相关数据库
HACER:human增强子数据库
SEdb:超级增强子数据库简介
dbSUPER:人和小鼠中的超级增强子数据库
dbCoRC:核心转录因子数据库
使用ROSE鉴定超级增强子

18年文章目录

2018年推文合集

扫描下方二维码，关注我们，解锁更多精彩内容！

生物信息入门

只差这一个

公众号

MDR的进阶版本-GMDR

相关文章

MDR软件的安装

MAR位数和MDR位数代表的含义

MAR位数反应存储单元的个数 MDR位数=存储字长

【信息安全】EDR、HIDS、NDR、MDR、XDR 区别与联系

转载 MAR、MDR以及ROM、RAM的区别和联系

MAR与MDR是什么？

MDR、XDR、PDR

存储系统结构、MDR、MBR、扇区