CATH数据库数据下载

embedded/2024/9/23 5:55:06/

CATH数据库提供了多种类型的数据供用户下载,涵盖了蛋白质的结构域分类、同源性分析、功能注释等方面。以下是CATH数据库提供的一些主要数据类型及其解释:

http://www.cathdb.info/download

1. 分类数据(Classification Data)

  • 文件:如cath-domain-list.txt
  • 内容:包含CATH数据库中所有蛋白质结构域的分类信息,按照CATH四级分类系统组织(Class、Architecture、Topology、Homologous superfamily)。
  • 解释:每一行表示一个结构域的分类信息,包括PDB ID、链ID、CATH分类号(CATH四级编号),这些编号可以帮助用户了解每个结构域在CATH分类中的位置。

2. 非冗余数据集(Non-redundant Data Sets)

  • 文件:如cath-dataset-nonredundant-S40-v4_0_0.list
  • 内容:包含序列相似性低于指定阈值的结构域列表。例如,S40数据集中的结构域序列相似性不超过40%。
  • 解释:这些数据集用于去除数据中的冗余,保证不同结构域之间的多样性。可以用于机器学习模型的训练集、测试集构建等。

此外,还有序列数据、同源超家族信息以及pdb结构数据等。

CATH数据库提供了多种类型的数据下载,涵盖了蛋白质结构域的分类、序列、三维结构、同源家族信息以及功能注释等。这些数据可以用于蛋白质结构和功能研究、机器学习模型的训练集构建、同源建模、序列比对和进化分析等生物信息学领域的广泛应用。


http://www.ppmy.cn/embedded/109935.html

相关文章

Kubernetes

1、概念 希腊语,舵手、飞行员的意思 k8s可以理解成负责自动化运维管理多个容器化的应用集群。容器编排框架的工具,是谷歌基于go语言开发的 2、作用 用于自动部署、扩展、管理容器化部署的应用程序,是(半)开源的 k…

Vscode——调试时,修改变量值

第一步:点击变量,鼠标右键 第二步:点击 设置值

“深入解析:MySQL半同步复制的配置指南与实践技巧“

本次配置是在已搭建好主从复制的架构中进行配置 配置环境 操作系统 master节点 slave节点 centos7 8.0.37 8.0.37 配置半同步复制 配置master 安装master半同步复制插件 INSTALL PLUGIN rpl_semi_sync_source SONAME semisync_source.so; 在MySQL的配置文件中添加配置…

前端开发中 em/px/rem/vh/vw区别

传统的项目开发中,我们只会用到px、%、em这几个单位,它可以适用于大部分的项目开发,且拥有比较良好的兼容性从CSS3开始,浏览器对计量单位的支持又提升到了另外一个境界,新增了rem、vh、vw、vm等一些新的计量单位利用这…

命令模式(Command Pattern)

命令模式(Command Pattern)是一种行为设计模式,它将一个请求封装为一个对象,从而使你可以使用不同的请求、队列或日志来参数化对象。命令模式让你可以在不修改调用对象的情况下将请求排队、记录日志或撤销操作。 核心思想&#x…

利用深度学习实现验证码识别-4-ResNet18+imagecaptcha

在当今的数字化世界中,验证码(CAPTCHA)是保护网站免受自动化攻击的重要工具。然而,对于用户来说,验证码有时可能会成为一种烦恼。为了解决这个问题,我们可以利用深度学习技术来自动识别验证码,从…

【CSS】mask-image属性的详细介绍

mask-image属性是CSS中一个用于指定元素遮罩图像的属性。它允许开发者通过图像来遮罩元素的背景或其他图像内容,实现复杂的视觉效果。以下是对mask-image属性的详细介绍: 一、属性定义 mask-image属性定义了一个图像的遮罩层,该遮罩层将应用…

Java——踩坑Arrays.asList()

坑1:不能直接使用 Arrsys.asList() 来转换基本类型数据 public static void test1(){// 1、不能直接使用asList来转换基本类型数组int[] arr {1, 2, 3};List list Arrays.asList(arr);System.out.printf("list:%s size:%s class:%s", list, list.size(…