ChAMP加载肺癌数据和分析甲基化数据流程

server/2024/9/25 10:18:04/

ChAMP加载肺癌数据和分析甲基化数据流程

在这里插入图片描述

1. 加载数据分析

R">#!/bin/evn R 
rm(list = ls())
library(rstudioapi)
current_script_path <- getActiveDocumentContext()$path# 将路径转换为当前目录
current_directory <- dirname(current_script_path)# 设置当前工作目录
setwd(current_directory)
getwd()library(ChAMP)
library(minfi)
library(Illumina450ProbeVariants.db)
library(sva)
library(IlluminaHumanMethylation450kmanifest)
library(limma)
library(RPMM)
library(DNAcopy)
library(preprocessCore)
library(impute)
library(marray)
library(wateRmelon)
library(goseq)
library(plyr)
library(GenomicRanges)
library(optparse)
library(pheatmap)
library(ggplot2)
filepath='D:/aR_project/methylation/extdata'arraytype="450K"
out = "DNAmearray"## 数据导入与过滤
data <- champ.load(filepath,arraytype = arraytype)# 输出 data 的列名
names(data)
# [1] "beta"      "intensity" "pd"   # 输出 data$beta 的维度
dim(data$beta)
# [1] 403116      8# 检查是否存在缺失值
table(is.na(data$beta))
# FALSE 
3224928 # 输出 data$beta 的前几行
data$beta[1:2, 1:8]C1        C2        C3        C4        T1        T2        T3        T4
cg00000957 0.7927427 0.8162839 0.8726977 0.8476140 0.8732848 0.8281842 0.6992366 0.7535339
cg00001349 0.6733450 0.6275007 0.6769735 0.7097567 0.4665632 0.7616798 0.2443499 0.4557010# 输出 data$intensity 的维度
dim(data$intensity)
# [1] 403116      8# 输出 data$pd 的维度
dim(data$pd)
# [1] 8 8

extdata文件夹内包含数据如下:

image-20240527104407541

2. 数据质控

读取数据之后需要进行一些质控。

直接一个函数搞定:champ.QC()

champ.QC(beta = data$beta,pheno=data$pd$Sample_Group,mdsPlot=TRUE,densityPlot=TRUE,dendrogram=TRUE,PDFplot=TRUE,Rplot=TRUE,Feature.sel="None",resultsDir="./")

会生成3张图,放在CHAMP_QCimages这个文件夹下。

  • MDS plot:根据前1000个变化最大的位点看样品相似性。
  • densityPlot:每个样品的beta分布曲线,比较离群的可能是质量比较差的样本。
  • 聚类图

image-20240527113605782

image-20240527113640210

image-20240527113700698

3. 标准化

使用champ.norm()函数实现,提供4种方法:

  • BMIQ,
  • SWAN,
  • PBC,
  • FunctionalNormliazation

FunctionalNormliazation需要rgSet对象,SWAN需要rgSetmset,PBC和BMIQ只需要beta 矩阵,FunctionalNormliazation和SWAN需要在读取数据时使用method = "minfi"

myNorm <- champ.norm(beta = myLoad$beta,arraytype = "EPIC",cores = 8)

3.1 方法解释

  1. BMIQ (Beta Mixture Quantile Normalization)

    • 用途:用于标准化 β 值,使其在各个样本之间具有相似的分布。

    • 输入:只需要 β 值矩阵(beta)。

    • 使用方法

      myNorm <- champ.norm(beta = myLoad$beta,method = "BMIQ",arraytype = "EPIC",cores = 8)
      
  2. SWAN (Subset-quantile Within Array Normalization)

    • 用途:考虑 Illumina BeadChip 上不同探针类型的差异,通过调整其分布来进行标准化。

    • 输入:需要 β 值矩阵(beta),以及 RGSet 和 MSet 对象。

    • 使用方法

      myNorm <- champ.norm(beta = myLoad$beta,rgSet = myLoad$rgSet,mset = myLoad$mset,me

http://www.ppmy.cn/server/43488.html

相关文章

java spring cloud 企业工程管理系统源码+二次开发+定制化服务 em

在建筑行业中&#xff0c;工程项目管理软件&#xff08;工程项目管理系统&#xff09;扮演着至关重要的角色&#xff0c;它为建设工程项目管理提供了全方位、全过程的综合管理支持。从项目组织建设、策划决策、规划设计&#xff0c;到施工建设、竣工交付、总结评估&#xff0c;…

EventSource

什么是EventSource EventSource 是一个用于服务器推送事件&#xff08;Server-Sent Events, SSE&#xff09;的接口&#xff0c;它允许服务器推送实时更新到浏览器。与 WebSocket 不同&#xff0c;SSE 是单向的&#xff08;服务器到客户端&#xff09;&#xff0c;适用于更新频…

【Pandas】深入解析`pd.read_pickle()`函数

【Pandas】深入解析pd.read_pickle()函数 &#x1f308; 欢迎莅临我的个人主页&#x1f448;这里是我深耕Python编程、机器学习和自然语言处理&#xff08;NLP&#xff09;领域&#xff0c;并乐于分享知识与经验的小天地&#xff01;&#x1f387; &#x1f393; 博主简介&…

慢性乙型肝炎肝脏剪切波弹性成像的深度学习放射学显著改善了肝纤维化的诊断性能 | 文献速递-深度学习结合影像组学

慢性乙型肝炎肝脏剪切波弹性成像的深度学习放射学显著改善了肝纤维化的诊断性能 | 文献速递-深度学习结合影像组学 麦田医学 美好事物中转站 2024-05-21 11:03 Title 题目 Deep learning Radiomics of shear wave elastography significantly improved diagnostic performa…

时空AI软件:地理信息与遥感领域的智慧引擎

在地理信息与遥感技术的广阔疆域&#xff0c;时空AI软件如同一颗璀璨新星&#xff0c;将时空信息与智能深度融合&#xff0c;驱动着地理信息分析、决策支持、环境监测、城市规划等领域的深刻变革。本文将深入剖析其技术核心、应用实例、未来趋势&#xff0c;探索时空AI软件如何…

ML307R OpenCPU 网络初始化流程介绍

一、网络初始化流程 二、函数介绍 三、示例代码 四、代码下载地址 一、网络初始化流程 模组的IMEI/SN获取接口可在include\cmiot\cm_sys.h中查看,SIM卡IMSI/ICCID获取接口可以在include\cmiot\cm_sim.h中查看,PDP激活状态查询可以在include\cmiot\cm_modem.h中查看 二、函…

源码编译安装LAMP(安装apeche mysql php 论坛 网站 巨详细版)

目录 一.LAMP架构相关概述 1.各组件作用 Linux&#xff08;平台&#xff09; Apache&#xff08;前台&#xff09; MySQL&#xff08;后台&#xff09; PHP/Perl/Python&#xff08;中间连接&#xff09; 总结 二.编译安装Apache httpd服务 1.关闭防火墙&#xff0c;将…

什么是DNS缓存投毒攻击,有什么防护措施

随着企业组织数字化步伐的加快&#xff0c;域名系统&#xff08;DNS&#xff09;作为互联网基础设施的关键组成部分&#xff0c;其安全性愈发受到重视。然而&#xff0c;近年来频繁发生的针对DNS的攻击事件&#xff0c;已经成为企业组织数字化发展中的一个严重问题。而在目前各…