BRAF蛋白V600E突变的影响
目的:使用Cosmic、Clinvar、dbsnp等多种数据库,注释错义突变对蛋白质功能、稳定性和相互作用的影响。
步骤:
- 查找突变数据:选择癌症相关基因BARF,从COSMIC数据库下载BARF错义突变数据。
- 查找结构数据:进入PDB,搜索BRAF,下载BRAF蛋白质单体的结构pdb文件、以及BRAF与其他蛋白结合的复合物pdb文件。
- 突变数据分析:使用R语言,统计突变相关位点,筛选出高频率突变位点。
- 使用cBioPortal工具对突变进行可视化。
- 使用dbsnp、ClinVar、pdbsum等数据库对BRAF相关突变信息调研。
- 使用IBIS数据库对BRAF结合位点进行调研。
- NCBI Biosystem、uniprot、pubmed等数据库对BRAF相关通路信息调研。
一、COSMIC数据下载
进入COSMIC,搜索BRAF基因,查找突变信息,可以看出来,Mutation中99.11%为Missense substitution,选择Missense substitution,下载全部错义突变数据,共计50046条记录。
图表 1 突变类型分布
接下来,使用R语言,统计错义突变的分布,由饼状图可以发现,在93.8%的样本中,第600位缬氨酸(V)突变为谷氨酸(E),这暗示着V600E在全部的Missense mutation中有着很强的统计学意义。并且可以发现: D594,F595,G596,L597,A598,T599,V600,K601这一小段的氨基酸序列突变频率远高出其他区域,暗示着这段氨基酸序列对整体结构有着极为重要的意义。
图表 2错义突变类型分布
二、pdb数据库调研
进入pdb数据库,搜索BRAF蛋白,选取一个“BRAF蛋白+其他蛋白复合物”和一个BRAF蛋白质单体。蛋白质复合物需要完整蛋白,不能是肽段,而且均需要来源于人类。经过一系列仔细审查,最终选择编号“4MNE的BRAF+MEK1蛋白质复合物”以及“4WO5的BRAF蛋白质单体”。
三、cBioPortal可视化
由于记录总数达到50046条,因此选择至少在两个样本中出现的突变,共计78种突变类型,转化成bed文件格式,放入cBioPortal进行可视化。可以发现在“酪氨酸激酶功能域”上突变有明显地富集,特别是第600位氨基酸附近,突变种类十分丰富。
图表 3cBioPortal突变可视化
接下来,显示蛋白质的3D structure,可以发现这一小段氨基酸位于蛋白质的环状区域。
图表 4 cBioPortal chain B结构可视化
图表 5 cBioPortal chain C结构可视化
图表 6 cBioPortal chain F结构可视化
图表 7cBioPortal chain G结构可视化
四、NCBI数据库调研
将COSMIC下载的数据进行格式转换,处理成bed文件格式,提交至NCBI variation viewer,在ClinVar一栏有着许多紫色与绿色盒子,紫色盒子表明致病变体,绿色盒子表明良性变体,发现在chr7:140753335附近处,ClinVar的致病突变明显富集,加号紫色盒子里面有着33个突变样本,而且COSMIC里的突变数据也富集在此处。
图表 8 NCBI variation viewer
选择V600E疾病样本点进ClinVar数据库,发现该突变可以引发很多种疾病,提交次数多达25次,会导致以下疾病:Gastrointestinal stromal tumor、Lung cancer、Malignant melanoma of skin、Multiple myeloma、Squamous cell carcinoma of the head and neck、Papillary thyroid carcinoma、Adenocarcinoma of lung、Non-small cell lung cancer、Carcinoma of colon、Astrocytoma, low-grade, somatic、Germ cell tumor, nonseminomatous、NONSEMINOMATOUS GERM CELL TUMORS, SOMATIC、VARIANT OF UNKNOWN SIGNIFICANCE、Neoplasm of brain、Malignant melanoma、Glioblastoma、Brainstem glioma、Neoplasm、Cardio-facio-cutaneous syndrome、Ovarian Neoplasms、Colorectal Neoplasms、Papillary renal cell carcinoma, sporadic、Colonic Neoplasms。
图表 9 ClinVar数据库调研
接着,选择同一突变,点进dbSNP数据库,发现V600的各种missense mutation同样也在dbSNP数据库存储。
图表 10dbSNP数据库调研
然后,链接进入NCBI Structure数据库,使用Cn3D对突变进行可视化,发现V600处于一个环状结构的转角处。
图表 11 Cn3D可视化
五、其他数据库调研
Uniprot
进入Uniprot搜索BRAF蛋白,可以得到关于BRAF蛋白更多更全面的信息。首先,该蛋白与RGS14和RAF1(Ras-Raf-MAPK通路中重要蛋白)共同存在于“细胞质”和“细胞膜”上,在“细胞核”内也有存在。
图表 12uniprot BRAF定位
其次,在OMIM中有报道,BRAF蛋白质的损坏会导致包括Colorectal cancer 、Lung cancer、Familial non-Hodgkin lymphoma、Cardiofaciocutaneous syndrome 1、Noonan syndrome 7、LEOPARD syndrome 3在内的多种疾病。
并且,BRAF的V600E是最常见的体细胞突变,能有效提高BRAF的激酶活性,会导致包括sarcoma、Colorectal cancer、metastatic melanoma、ovarian serous carcinoma、pilocytic astrocytoma在内的多种疾病。
Pdbsum
进入Pdbsum数据库搜索4MNE,选择BRAF蛋白质,发现该蛋白有着“Raf-like Ras-binding domain”、“C1_1”和“Protein tyrosine kinase”三个保守结构域,而V600位于“酪氨酸激酶”结构域,该蛋白催化着ATP + a protein = ADP + a phosphoprotein的反应
图表 13Pdbsum催化反应
六、多序列比对
下载uniprot中源自不同物种BRAF蛋白质序列,分别来自“绿脓杆菌”、“老鼠”、“人类”、 “鸡”和“鹌鹑”。使用cluster Omega进行多序列比对,并且绘制进化树,从进化树可以看出来多序列比多没有问题,“绿脓杆菌”作为外类,和其他物种距离较远。
图表 14进化树
而且,仔细观察多序列比对结果,发现G596、L597、T599、V600有着很高的保守性。
图表 15多序列比对结果
七、IBIS蛋白质相互作用
打开IBIS网页,并搜索4MNE结构链B (4MNE的B, C, F, G链为BRAF蛋白),直接可视化所有与4MNE结构中BRAF蛋白有着相互作用的结构,可以观察到MEK1,Cyclin这些信号通路中关键蛋白(后续pubmed文献中也证实这些蛋白与BRAF有着结合)。
图表 16 IBIS Protein-protein interactions
接着,转到“protein-protein”选项卡,可以看到4MNE自身在“STKc_Raf”和“PKc_MEK1”域的标签栏目中被检索到,显示BRAF与“其他蛋白的STKc_Raf和PKc_MEK1结构域”存在相互作用,在BRAF序列上的三角形表示结合位点,红色表示高度保守的结合位点。
Interaction Partner | Ranking Score | Number of Cluster Members | Average %Identity to Query | Number of Binding Site Residues | Taxonomic Diversity |
---|---|---|---|---|---|
STKc_Raf2.8 | 46 | 88 | 40 | Eukaryota | |
PKc_MEK1 | singleton | 2 | 100 | 29 | Homo sapiens |
图表 17 List of protein interaction partners
八、Biosystems信号通路查询
进入NCBI biosystems,搜索“BRAF V600E”,可以查到三条记录“Signaling by high-kinase activity BRAF mutants”、“Signaling by moderate kinase activity BRAF mutants”和“Paradoxical activation of RAF signaling by kinase inactive BRAF”,阐述了BRAF在8%人类癌症中突变,而且大多数BRAF突变落在“激酶区”或者其相邻的“激活环区”,通过“模拟活化环的磷酸化作用”或者“促进酶的活性构象”来增加激酶活性。而且,大约90%的BRAF突变体都是单次错义突变V600E。
相关链接:
https://www.ncbi.nlm.nih.gov/biosystems/1457783
https://www.ncbi.nlm.nih.gov/biosystems/1457784
https://www.ncbi.nlm.nih.gov/biosystems/1457785
九、Pubmed文献查询
BRAF的研究:
其实,早在2002年,Nature上就有关于BRAF V600E突变的研究,第1799位核苷酸T突变为A(T1799A2),导致其编码蛋白第600位谷氨酸取代了缬氨酸,通过消除激酶域与甘氨酸P环间的相互作用,模仿T599和S602两个位点同时被磷酸化的效果,突变后的BRAF蛋白的激酶活性会较野生型提高500倍。
后来,2010年,Cell上又发表封面文章,研究发现致死性突变的BRAF V600E需要与致癌基因RAS共同作用,一起促进肿瘤的生长发育。
事实上,BRAF V600E突变位点已经应用于临床检测。2011 年,首个BRAFV600E 靶向抑制剂威罗菲尼被FDA 批准上市,用于治疗BRAFV600E 突变的晚期黑色素瘤患者,有效延长了患者无进展生存期及总生存期,取得了突破性的治疗效果,也是典型的基于基因诊断选择用药的靶向治疗药物。
相关文献:
Hubbard SR,Oncogenic mutations in B-Raf: some losses yield gains. Cell, 116(6):764-6.
Wan PT,Mechanism of activation of the RAF-ERK signaling pathway by oncogenic mutations of B-RAF. Cell, 2004.116(6):855-67. PMID: 15035987
Davies H,Mutations of the BRAF gene in human cancer. Nature,2002 Jun 27;417(6892):949-54. PMID: 12068308