UMI简介

news/2025/1/11 7:11:58/

关于UMI的一些东西,概念,位置,如何处理

UMI是什么

UMI全称:Unique Molecular Identifiers
又称分子条形码技术,是对原始样本基因组打断后的每一个片段都加上一段特有的标签序列,用于区分同一样本中成千上万的不同的片段,在后续的数据分析中可以通过这些标签序列来排除由于 DNA 聚合酶和扩增以及测序过程中所引入的错误。分子条形码通常由大约 10nt 左右的随机序列(比如 NNNNNNN),或者简并碱基(NNNRNYN)组成。
有别于样品标签(sample indexsample barcode),分子条形码是针对同一个样本中的不同片段加上的标签序列,而样品标签是用于区分不同样本而加上的标签序列。
因此,每一个样本只能有一个相同的样品标签,但可以有成千上万的分子条形码。

UMI是给同一个样本的不同片段打上标签

UMI加在哪里?

双端index,如果一端的index已经可以区分不同的样本。则另一端index的位置上可以用UMI来代替。即UMIindex的位置上。UMI的长度与index相同。

UMI也可以加在插入片段中,在indexUMI之间可能需要连接酶链接。在我们的某个项目中,UMI就是加在插入片段中,indexUMI之间有8bp的酶切位点。

UMI如何处理?

使用fastpgencore软件可以很方便的处理UMI

标记UMI

使用fastp标记reads上的UMI序列

fastp -i R1.fq -o out.R1.fq -U --umi_loc=read1 --umi_len=8

--umi_loc指定UMI的位置,如果是在reads上,则还需要指定UMI的长度。

FASTP用法

得到一致性序列

使用gencore的可以得到一致性序列

gencore -i in.bam -o out.bam -r hg19.fa -s 3 --umi_prefix=UMI --ratio_threshold=0.9

http://www.ppmy.cn/news/262125.html

相关文章

cimoc 最新版_Cimoc官方版

Cimoc怎么更新?Cimoc官方最新版是一款非常不错的漫画阅读软件,Cimoc官方版里具有海量的优质小说资源,用户可一键搜索查询自己喜爱的漫画阅读,同时支持离线下载阅读,线上阅读等功能,让你随时免费阅读漫画&am…

为了不被裁之NVMe-MI oob

为了不被裁之NVMe-MI oob Nvme-MIoob(out-of-band)MI命令执行过程NVMe MI报文Message Header:Message Data:Message Integrity Check: NVMe MI报文分类1. Response Message格式2. Control Primitive格式3. NVMe MI Command格式4. NVMe Admin …

第七届全球超宽带高峰论坛在迪拜开幕;爱立信公布2021年第三季度财报 | 全球TMT...

海外市场 爱立信公布2021年第三季度财报。集团有机销售额同比下降1%,报告销售额为563亿瑞典克朗(2020年同期为575亿瑞典克朗)。网络业务有机销售额同比增长稳定。报告的息税前利润率为23.7%(2020年同期为22.0%)。报告的…

iommu介绍

iommu功能 IOMMU主要功能包括DMA Remapping和Interrupt Remapping,这里主要讲解DMA Remapping,Interrupt Remapping会独立讲解。对于DMA Remapping,IOMMU与MMU类似。IOMMU可以将一个设备访问地址转换为存储器地址,下图针对有无IO…

tmux简介

tmux是什么 tmux是一个 terminal multiplexer(终端复用器),它可以启动一系列终端会话。我们使用命令行时,打开一个终端窗口,会话开始,执行某些命令如fio ,dd,scp,关闭此…

USACO-Moo Operations

题目描述 Because Bessie is bored of playing with her usual text string where the only characters are C, O, and W, Farmer John gave her �Q new strings (1≤�≤100)(1≤Q≤100), where the only characters are M and O. Bessies favorite word…

MEX有关的学习

MEX是一段区间内未出现的最小正整数。 所以向该区间加一个数只有加入该区间的mex值时才能增加; 我们来看两个题目 Problem - C - Codeforceshttps://codeforces.com/contest/1699/problem/C首先我们可以思考一个区间【L,R】的mex是x,说明【0&#xff…

mio-emio 接口

在玩了zedboard一段时间之后,这两天又回到了最基础的gpio,axi_gpio,mio,emio.也把ug585的部分章节,看了看,又有了许多新的发现,可能学习就是这样吧,温故而知新,说不定下一次在回过头来看mio的时候&#xff…