从RNA测序数据中推断差异RNA编辑位点的统计推断

server/2024/11/25 16:36:09/

从RNA测序数据中推断差异RNA编辑位点的统计推断

描述

本仓库包含两个R函数,用于运行REDITs(RNA编辑测试)来调用差异RNA编辑位点:

  1. 在病例-对照(或条件1 vs 条件2)队列之间显著不同的RNA编辑位点
    • 由REDIT-LLR(RNA编辑测试 - 对数似然比)处理
  2. 显著与分类变量(例如性别、性别)和/或定量变量(例如ADAR表达、年龄)相关的RNA编辑位点
    • 由REDIT-Regression(RNA编辑测试 - 回归)处理

这些测试考虑了编辑中的生物学变异和从计数数据(如RNA-seq)计算编辑时的固有不准确性。因此,它们在5%假阳性阈值及以下比常用的替代方法(如t检验、Wilcoxon秩和检验或合并Fisher精确检验)具有更大的功效和更低的假阳性。

相关出版物

这项工作来自:通过分层建模从RNA测序数据中推断差异RNA编辑位点的统计推断

目录

  1. 安装
  2. 使用方法
    • REDIT-LLR
    • REDIT-Regression
    • 多重检验校正
    • 并行化
  3. 致谢
  4. 许可证

安装

你只需要基础的 R

REDITs中的两个测试都使用了stats包中的optim函数,这是一个基础包,在R中自动包含并加载。

如果你想使用下面的示例代码进行并行化,那么你需要安装

  1. doParallel
  2. foreach

但是REDITs中的实际测试(单独运行速度非常快)并不使用这些包。除非你计划在一个包含数百万编辑位点的数据集上运行,否则它们也不需要并行化。

使用方法

REDIT-LLR

source("REDIT_LLR.R")

函数文档

REDIT_LLR(data, groups)

data: 一个2xn的数值矩阵。第一行包含支持编辑的计数(例如RNA-seq读数)。第二行包含支持非编辑的计数。每一列对应一个样本的数据。

groups: 一个字符向量,对应于2xn数据矩阵中每一列的条件/队列/疾病-对照成员。它必须恰好有两个唯一的字符串。length(unique(groups)) == 2

返回值: 一个列表

  • data and groups: 原始数据和groups参数
  • mle.for.group.disease, mle.for.group.control, and mle.for.null.model: 疾病和对照组以及零模型的beta分布的最大似然估计。你可以通过将各自的alpha / (alpha+beta)来获得每个条件的平均编辑水平。然而,请注意,这些估计值不足以获得编辑水平的最大似然方差。
  • log.likelihood.for.group.disease, log.likelihood.for.group.control, and log.likelihood.for.null: 对应最大似然估计的对数似然值
  • p.value: 测试该编辑位点在疾病-对照组之间是否具有统计显著性的p值。

列表元素的实际名称将根据groups参数中的两个唯一字符串而变化。

代码示例

>source("REDIT_LLR.R")
>the_data = matrix( c(1,9, 2,9, 8,1,10,0),nrow=2)
>the_groups = c('disease','disease','control','control');
>REDIT_LLR(data=the_data, groups=the_groups)
>> 
$data[,1] [,2] [,3] [,4]
[1

http://www.ppmy.cn/server/144841.html

相关文章

神经网络(系统性学习四):深度学习——卷积神经网络(CNN)

相关文章: 神经网络中常用的激活函数神经网络(系统性学习一):入门篇神经网络(系统性学习二):单层神经网络(感知机)神经网络(系统性学习三)&#…

【数据结构】【线性表】一文讲完队列(附C语言源码)

队列 队列的基本概念基本术语基本操作 队列的顺序实现顺序队列结构体的创建顺序队列的初始化顺序队列入队顺序队列出队顺序队列存在的问题分析循环队列代码汇总 队列的链式实现链式队列的创建链式队列初始化-不带头结点链式队列入队-不带头节点链式队列出队-不带头结点带头结点…

【Pytest+Yaml+Allure】实现接口自动化测试框架

一、框架思想 requestsyamlpytestallure实现接口自动化框架。结合数据驱动和分层思想,将代码与数据分离,易维护,易上手。使用yaml编写编写测试用例,利用requests库发送请求,使用pytest管理用例,allure生成…

在ubuntu中查看csv

在 Ubuntu 中查看 CSV 文件的内容有多种方法。以下是一些常用的方法: 使用命令行工具 cat 命令 如果文件不大,可以使用 cat 命令快速查看文件内容: cat 10_11_query.csvless 命令 对于较大的文件,less 是一个更好的选择&#xf…

高新技术行业中的知识管理:关键性、挑战、策略及工具应用

知识管理的关键性 在瞬息万变的信息时代,知识已成为高新技术行业的核心竞争要素。知识管理,这一旨在高效组织、整合并应用企业内外部知识资源的管理策略,对于推动高新技术企业的持续创新与发展至关重要。它不仅能够激发研发团队的创造力&…

【数据结构】—— 线索二叉树

引入 我们现在提倡节约型杜会, 一切都应该节约为本。对待我们的程序当然也不例外,能不浪费的时间或空间,都应该考虑节省。我们再观察团下图的二叉树(链式存储结构),会发现指针域并不是都充分的利用了,有许…

【创建型设计模式】单例模式

【创建型设计模式】单例模式 这篇博客接下来几篇都将阐述设计模式相关内容。 接下来的顺序大概是:单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。 一、什么是单例模式 单例模式是一种创建型设计模式,它保证一个类仅有一个实例&#…

Kafka日志索引详解以及生产常见问题分析与总结

文章目录 一、Kafka的Log日志梳理1.1、Topic下的消息如何存储1.1.1、log文件追加记录所有消息1.1.2、index和timeindex加速读取log消息日志 1.2、文件清理机制1.2.1、如何判断哪些日志文件过期了1.2.2、过期的日志文件如何处理 1.3、Kafka的文件高效读写机制1.3.1、Kafka的文件…