PDB文件格式总结
pdb格式文件中对结构有充分的介绍。包括结构所得日期, 文献, 解析方式, 序列信息, 残基缺失情况, 原子坐标等等, 我们可 以先用记事本或者写字板打开
PDB文件中的记录类型
标题部分
- HEADER:分子类, 公布日期, ID号
- OBSLTE:注明此ID号已废弃, 改用新ID号
- TITLE:说明实验方法类型
- CAVEAT:可能的错误警告
- COMPND:化合物分子组成
- SOURCE:化合物来源
- KEYWDS:关键词
- EXPDTA:测定结构所用的实验方法
- AUTHOR:结构测定者
- REVDAT:修订日期及相关内容
- SPRSDE:已撤销或更改的相关记录
- JRNL:发表坐标的期刊
- REMARK REMARK 1:有关文献 REMARK 2:最大分辨率 REMARK 3:用到的程序和统计方法. 记述结构优化的方法和相关统计数据 REMARK 4-999: 其他信息
一级结构
- DBREF:其他序列库的有关记录
- SEQADV:PDB与其他记录的出入
- SEQRES:残基序列
- MODRES:对标准残基的修饰
杂因子
- HET: 非标准残基
- HETNAM:非标准残基的名称
- HETSNY:非标准残基的同义字
- FORMOL: 非标准残基的化学式
二级结构
- HELIX:螺旋. 标识螺旋的位置和类型 (右手 α \alpha α 螺旋等), 每个螺旋一条记录.
- SHEET:片层. 标识每个片层的位置, 类型 (sense, 如反平行等), 相对 于模型中每个束的片层 (如果存在的话) 中前一束的说明, 每个片层一条记 录.
- TURN: 转角
连接注释
- SSBOND:二硫键. 定义半胱氨酸CYS残基
之间的二硫键 - LINK:残基间化学键
- HYDBND:氢键
- SLTBRG:盐桥
- CISPEP:顺式残基
晶胞特征及坐标变换
- CRYST1:晶胞参数 (NMR除外). 记述晶胞结构参数 (a, b, c, a , β , γ a, \beta, \gamma a,β,γ, 空间群) 以及 Z Z Z 值 (单位结构中的聚合链数).
- ORIGXn:直角-PDB坐标
- SCALEn:直角-晶体分数坐标 ( n = 1 , 2 , 3 (\mathrm{n}=1,2,3 (n=1,2,3, NMR除外). 说明数据中直角坐 标向晶体分数坐标的变换因子.
- MTRIXn:非晶相对称
- TVECT: 平移矢量
坐标部分
- MODEL:多亚基时显示亚基号 当一个PDB文件中包含多个结构时 (例:NMR结构解 析), 该记录出现在各个模型的第一行. MODEL记录行的第11-14列上记入模型序号. 序号从 1 开始顺序记入, 在11-14列中从右起写. 比如说有 30 个模型, 则第 1 至 9 号模 型, 该行的7-13列空白, 在14列上记入 1-9的数字; 第10-30号模型, 该行的7-12列 空白, 13-14列上记入 10 − 30 10-30 10−30 的数字.
- ATOM:标准残基的原子. 记述标准残基 (氨基酸以及核酸) 中各原子的原子名称, 残基名称, 直角坐标 (单位埃), 占有率, 温度因子等信息.
- SIGATM:标准差
- ANISOU:各向异性
- SIGUIJ:各种温度因素导致的标准差
- TER: 残基链的末端. 表示残基链的结束. 在每个聚合链的末端都必须有TER记录, 但因序列无序造成的链中断处不需要该记录. 例如, 一个血红蛋白分子包含四个亚 链. 彼此之间并不相连. TER标识了每条链的结束, 以防显示时这条链与下一条相连.
- HETATM:非标准残基的原子. 记述非标准残基 (标准氨基酸以及核酸以外的化合物, 包括抑制剂, 辅因子, 离子, 溶剂) 中各原子的原子名称, 残基名称, 直角坐标 (单 位埃), 占有率, 温度因子等信息. 与ATOM记录的唯一区别在于HETATM残基默认情况 下不会与其他残基相连. 注意, 水分子也应放在此记录中.
- ENDMDL:亚基结束. 与MODEL记录成对出现, 记述在各模型的链末端的TER记录之 后.
连接信息部分
- CONECT:原子间的连接信息
九. 簿记 - MASTER:版权拥有者
- END:文件结束. 标志PDB文件的结束, 必需记录.