N50、N90

news/2024/10/22 16:37:38/

举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思。

如果中间有gap,但是可以知道gap的长度,这样的序列就叫做scaffold, 即脚手架(非连续)的意思。

然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条 contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50。很明显这个数值越大说明组装的质量越好。 
即:

从最长的开始倒数,数到长度为总长度一半的片段,最后一个被数到的片段越长,说明长的片段越多,最后组装的质量越好。 
N90:把50%改为90%即可。
 


http://www.ppmy.cn/news/209004.html

相关文章

关于罗马数字转整数的实现

1 整数 转 罗马数字 <script> // I1 V5 X10 L50 C100 D500 M1000 function int2rmn(n){ let s,b1; for(;n!0;){ let an%10*b; if(a1){sI} else if(a2){sIIs} else if(a3){sIIIs} else if(a4){sIVs} else if(a5){sVs} else if(a6){sVIs} else if(a7){sVIIs} else if(a8){…

MST52系列低压线性稳压器LDO

描述 MST52LXXB系列是一款输入电压可达30V&#xff0c;静态电流1.6uA&#xff0c;最大输出电流200mA的高压低功耗低压差线性稳压器。 MST52LXXB具有对输入电压瞬态和负载电流瞬态的快速响应&#xff0c;并确保MST52LXXB启动和短路恢复期间无过冲电压。 MST52LXXB系列集成短路…

contig N50---小脚本

文章目录 1. contig N50 的定义2. 脚本实现1. N50 计算&#xff1a;2. GC 含量计算 1. contig N50 的定义 基因组的统计信息包含GC含量&#xff0c;N50等等&#xff0c;这里我们计算N50的算法&#xff1a; N50是指一个基因组所有的contig&#xff0c;按照长度从大到小排列&…

echarts与tp5.1(柱状图)

**简介&#xff1a;**利用echarts和tp5.1将数据以柱状图的形式展示。 div部分&#xff1a; <div id"chart1" style"height: 280px;"></div>JS部分&#xff1a; var myChart echarts.init(document.getElementById(chart1));var arr1[],arr2[…

2018年8月16日暑假训练日记

宾馆租期到了&#xff0c;早上打理了一下宿舍的事儿。 下午很难受的暴零了&#xff0c;大佬做出来个区间dp&#xff0c;我现学了期望dp&#xff0c;然后写了个期望dp超时了&#xff0c;要是m变成原来的一半就过了&#xff0c;正好卡死了&#xff0c;然后搞了一发假dp&#xff0…

统计fasta序列条数

1.统计大于号开始的行数或seqkit 工具 # 通过搜索>的数量 grep -c ^> myFasta.fasta 1397492 #seqkit统计提取&#xff0c;速度也是很快的 seqkit stats t.fa -T | grep -v file | cut -f 4 1397492 # 统计 1-100bp 范围长的序列数 cat t.fa | seqkit seq -m 1 -M 100 | …

linux系统tcl电视刷机包,【欢视商店】TCL电视RT95系列升级包与刷机包

原标题:【欢视商店】TCL电视RT95系列升级包与刷机包 以下为系列升级包与刷机包下载,提醒:原则上TCL不负责用户个人更改软件后的行为,所以刷机请谨慎!有需要的用户可以选择性下载使用。 首先小编先跟大家介绍一下固件升级方法及注意事项: 1)将获取的版本压缩包(解压)拷贝到F…

QUAST:评估基因组组装效果

欢迎关注"生信修炼手册"&#xff01; 对于不同kmer或者不同软件的基因组组装结果&#xff0c;我们通常会通过N50等指标来进行评估。 对于一个组装出来的序列&#xff0c;不论是contig还是scaffold, 首先将各个序列根据长度从大到小排序&#xff0c;然后从第一个序列开…