生物信息学

2024/9/19 18:55:41

CATH标识符解读

在CATH数据库中,标识符如1a0rB00、1a0rP01、1a0rP02代表的是蛋白质结构的具体信息,主要涉及PDB编号、链ID以及结构域。让我们具体解释这些标识符的含义。 CATH标识符的组成 CATH标识符通常由以下几个部分组成: PDB ID:代表蛋白…

易基因:儿童和成人实体瘤共有微小差异甲基化区域(mDMR)的全面分析 | 表观研究

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 癌症是美国1~14岁儿童第二大常见死因,每年约有11000例新发病例和1200例死亡病例。与成人癌症相比,儿童肿瘤通常突变负荷较低。然而儿童肿瘤的表观基因组发生显著变…

GATK ReadLikelihoodCalculationEngine接口介绍

ReadLikelihoodCalculationEngine 是 GATK(Genome Analysis Toolkit)中的一个接口,用于计算不同等位基因(haplotypes 或 alleles)下的测序读数的似然值。这些似然值在变异检测过程中起着关键作用,帮助确定哪些等位基因更可能是真实的遗传变异。 主要功能 ReadLikelihoo…

GATK AlleleList接口介绍

在 GATK(Genome Analysis Toolkit)中,AlleleList 接口是一个用来表示等位基因(alleles)列表的接口。Allele 是遗传学中用于表示某一特定基因座的不同形式的一个基本单位。AlleleList 接口定义了一些操作,使…

GATK ReadsPathDataSource类介绍

GATK(Genome Analysis Toolkit)是一个广泛使用的基因组分析工具包,它的核心库之一是htsjdk,用于处理高通量测序数据。在GATK中,ReadsPathDataSource类是负责管理和提供读取高通量测序数据文件(如BAM、SAM、…

GATK SampleList接口介绍

在 GATK 中,SampleList 是一个接口,用于表示一个样本列表。这些样本通常是在基因组分析过程中被处理的不同生物样本。SampleList 接口提供了访问这些样本的一些基本方法,通常用于多样本分析任务,比如变异检测或基因组重测序。 Sa…

GATK ReadsPathDataSource类介绍

GATK(Genome Analysis Toolkit)是一个广泛使用的基因组分析工具包,它的核心库之一是htsjdk,用于处理高通量测序数据。在GATK中,ReadsPathDataSource类是负责管理和提供读取高通量测序数据文件(如BAM、SAM、…

R语言绘图系列专栏 | 更新中

关于**《R语言绘图专栏》**,此专栏基于R语言绘制图形。每个图形我们会提供对应的R代码、数据和文本文档。此系列将会是一个长期更新的系列。 本系列教程,我们计划发表及收录使用R语言绘制50科研中常用图形。这是个长期的过程,计划花费3-4个的…

易基因:RNA修饰N4-乙酰胞苷(ac4C)的调控机制、检测方法及其在癌症中的作用最新研究进展|新方向

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 N4-乙酰胞苷(ac4C)是一种高度保守的化学修饰,广泛存在于真核和原核生物RNA中,如tRNA、rRNA和mRNA。这种修饰与多种人类疾病显著相关&#…

c++ 统计DNA序列k-mer个数

在DNA序列分析中&#xff0c;k-mer是指长度为k的连续子串或子序列&#xff0c;其中k表示k-mer的长度。k-mer在DNA序列分析中被广泛应用&#xff0c;用于描述DNA序列的局部特征、模式和组成&#xff0c;同时也用于构建DNA序列的模型和算法。 #include <iostream> #includ…

c++ 随机数

在 C 中生成随机数通常需要使用随机数生成器。C11 引入了 <random> 头文件&#xff0c;其中包含了用于生成随机数的类和函数。 1. 随机选择一个数 #include <iostream> #include <random>int main() {// 创建一个 random_device 对象用于生成随机种子std:…

易基因:泪腺RRBS+RNA-seq揭示Sjögren综合征相关干眼症的潜在基因|项目文章

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 Sjgren综合征&#xff08;Sjgren’s syndrome&#xff0c;SS&#xff09;相关干眼症是一种以泪腺&#xff08;lacrimal glands&#xff0c;LGs&#xff09;慢性炎症为特征的难治性自身免…

易基因:RNA修饰N4-乙酰胞苷(ac4C)的调控机制、检测方法及其在癌症中的作用最新研究进展|新方向

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 N4-乙酰胞苷&#xff08;ac4C&#xff09;是一种高度保守的化学修饰&#xff0c;广泛存在于真核和原核生物RNA中&#xff0c;如tRNA、rRNA和mRNA。这种修饰与多种人类疾病显著相关&#…

专栏十七:如何选择你的单细胞亚群的分辨率--chooseR

好久没更,没想到还是有小伙伴订阅,那就更一个最近看到的问题 1.缘起 是因为在文章Single-cell RNA sequencing and spatial transcriptomics reveal cancer-associated fibroblasts in glioblastoma with protumoral effects(https://doi.org/10.1172/JCI147087.)中看到 也…

GATK AlleleList接口介绍

在 GATK&#xff08;Genome Analysis Toolkit&#xff09;中&#xff0c;AlleleList 接口是一个用来表示等位基因&#xff08;alleles&#xff09;列表的接口。Allele 是遗传学中用于表示某一特定基因座的不同形式的一个基本单位。AlleleList 接口定义了一些操作&#xff0c;使…

htsjdk库SAMSequenceDictionary和SAMSequenceRecord类介绍

在 HTSJDK 库中&#xff0c;SAMSequenceDictionary 和 SAMSequenceRecord 类用于处理和管理基因组数据中的序列信息&#xff08;contigs&#xff09;。这两个类通常一起使用&#xff0c;提供了对基因组中所有 contig 的详细描述和访问。 SAMSequenceDictionary 类 主要功能 …