从RNA测序数据中推断差异RNA编辑位点的统计推断

news/2024/11/25 20:23:55/

从RNA测序数据中推断差异RNA编辑位点的统计推断

描述

本仓库包含两个R函数,用于运行REDITs(RNA编辑测试)来调用差异RNA编辑位点:

  1. 在病例-对照(或条件1 vs 条件2)队列之间显著不同的RNA编辑位点
    • 由REDIT-LLR(RNA编辑测试 - 对数似然比)处理
  2. 显著与分类变量(例如性别、性别)和/或定量变量(例如ADAR表达、年龄)相关的RNA编辑位点
    • 由REDIT-Regression(RNA编辑测试 - 回归)处理

这些测试考虑了编辑中的生物学变异和从计数数据(如RNA-seq)计算编辑时的固有不准确性。因此,它们在5%假阳性阈值及以下比常用的替代方法(如t检验、Wilcoxon秩和检验或合并Fisher精确检验)具有更大的功效和更低的假阳性。

相关出版物

这项工作来自:通过分层建模从RNA测序数据中推断差异RNA编辑位点的统计推断

目录

  1. 安装
  2. 使用方法
    • REDIT-LLR
    • REDIT-Regression
    • 多重检验校正
    • 并行化
  3. 致谢
  4. 许可证

安装

你只需要基础的 R

REDITs中的两个测试都使用了stats包中的optim函数,这是一个基础包,在R中自动包含并加载。

如果你想使用下面的示例代码进行并行化,那么你需要安装

  1. doParallel
  2. foreach

但是REDITs中的实际测试(单独运行速度非常快)并不使用这些包。除非你计划在一个包含数百万编辑位点的数据集上运行,否则它们也不需要并行化。

使用方法

REDIT-LLR

source("REDIT_LLR.R")

函数文档

REDIT_LLR(data, groups)

data: 一个2xn的数值矩阵。第一行包含支持编辑的计数(例如RNA-seq读数)。第二行包含支持非编辑的计数。每一列对应一个样本的数据。

groups: 一个字符向量,对应于2xn数据矩阵中每一列的条件/队列/疾病-对照成员。它必须恰好有两个唯一的字符串。length(unique(groups)) == 2

返回值: 一个列表

  • data and groups: 原始数据和groups参数
  • mle.for.group.disease, mle.for.group.control, and mle.for.null.model: 疾病和对照组以及零模型的beta分布的最大似然估计。你可以通过将各自的alpha / (alpha+beta)来获得每个条件的平均编辑水平。然而,请注意,这些估计值不足以获得编辑水平的最大似然方差。
  • log.likelihood.for.group.disease, log.likelihood.for.group.control, and log.likelihood.for.null: 对应最大似然估计的对数似然值
  • p.value: 测试该编辑位点在疾病-对照组之间是否具有统计显著性的p值。

列表元素的实际名称将根据groups参数中的两个唯一字符串而变化。

代码示例

>source("REDIT_LLR.R")
>the_data = matrix( c(1,9, 2,9, 8,1,10,0),nrow=2)
>the_groups = c('disease','disease','control','control');
>REDIT_LLR(data=the_data, groups=the_groups)
>> 
$data[,1] [,2] [,3] [,4]
[1

http://www.ppmy.cn/news/1549908.html

相关文章

鸿蒙开发-音视频

Media Kit 特点 一般场合的音视频处理,可以直接使用系统集成的Video组件,不过外观和功能自定义程度低Media kit:轻量媒体引擎,系统资源占用低支持音视频播放/录制,pipeline灵活拼装,插件化扩展source/demu…

《第十部分》1.STM32之通信接口《精讲》之IIC通信---介绍

经过近一周的USART学习,我深刻体会到通信对单片机的重要性。它就像人类的手脚和大脑,只有掌握了通信技术,单片机才能与外界交互,展现出丰富多彩的功能,变得更加强大和实用。 单片机最基础的“语言”是二进制。可惜&am…

flowable流程图详细绘制教程

文章目录 前言一、flowable是什么?回答下之前的问题 二、flowable-modeler使用1. 使用步骤2.开始绘制弄一个请假的流程 三 加载该流程总结 前言 flowable有些晦涩难懂的东西: 我最开始接触的时候,还是用的activity,当时觉得好复杂,那么这次经过我自己在…

初始Python篇(7)—— 正则表达式

找往期文章包括但不限于本期文章中不懂的知识点: 个人主页:我要学编程(ಥ_ಥ)-CSDN博客 所属专栏: Python 目录 正则表达式的概念 正则表达式的组成 元字符 限定符 其他字符 正则表达式的使用 正则表达式的常见操作方法 match方法的…

Java语言程序设计 选填题知识点总结

第一章 javac.exe是JDK提供的编译器public static void main (String args[])是Java应用程序主类中正确的main方法Java源文件是由若干个书写形式互相独立的类组成的Java语言的名字是印度尼西亚一个盛产咖啡的岛名Java源文件中可以有一个或多个类Java源文件的扩展名是.java如果…

Node.js 安装与环境配置详解:从入门到实战

**标题:Node.js 安装与环境配置详解:从入门到实战** --- ### 一、Node.js 简介 Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境,允许开发者在服务器端运行 JavaScript 代码。凭借其事件驱动、非阻塞 I/O 模型,Nod…

面试经典 150 题:205,55

205. 同构字符串 【解题思路】 来自大佬Krahets 【参考代码】 class Solution { public:bool isIsomorphic(string s, string t) {map<char, char> Smap, Tmap;for(int i0; i<s.size(); i){char a s[i], b t[i];//map容器存在该字符&#xff0c;且不等于之前映射…

2024年亚太地区数学建模C题完整思路

题目 随着人们消费理念的发展&#xff0c;宠物行业作为一个新兴产业&#xff0c;由于经济的快速发展和人均收入的提高&#xff0c;正在全球范围内逐渐积聚力量。1992年&#xff0c;中国小动物保护协会成立&#xff1b;1993年&#xff0c;皇家宠物食品&#xff08;Royal Canin&…