全基因组基因家族成员相关数据获取

news/2024/11/7 6:37:07/
一、基本分析内容
数据库检索与成员鉴定
进化树构建
保守domain和motif分析.
基因结构分析.
转录组或荧光定量表达分析.
二、数据库检索与成员鉴定
1、数据库检索
1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了
Brachypodiumdb:http://www.brachypodium.org/
TAIR:http://www.arabidopsis.org/
Rice Genome Annotation Project :http://rice.plantbiology.msu.edu/.
Phytozome:http://www.phytozome.net/
Ensemble:http://ensembl.gramene.org/genome_browser/index.html 
NCBI基因组数据库:http://www.ncbi.nlm.nih.gov/assembly/?term=
2)已鉴定的家族成员获取。
      如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:
     a. NCBI: nucleotide and protein db.
     b. EBI: http://www.ebi.ac.uk/.
     c. UniProtKB:http://www.uniprot.org/uniprot/
2、比对工具。一般使用blast和hmmer,具体使用命令如下:
本地BLAST比对:formatdb–i db.fas–p F/T;
blastall–p blastp(orelse) –i known.fas–d db.fas–m 8 –b 2(or else) –e 1e-5 –o alignresult.txt.
-b:output two different members in subject sequences (db).
oHmmer (hidden Markov Model) search. Thesame as PSI-BLAST in function. It has a higher sensitivity, but the speed islower.
Command:
hmmbuild--informatafaknown.hmmalignknown.fa; 
 hmmsearchknown.hmmdb.fas>align.out.
3、过滤。
Identity: 至少50%.
Cover region: 也要超过50%或者蛋白结构域的长度.
domain: 必须要有完整的该蛋白家族的。工具pfamdb (http://pfam.sanger.ac.uk/) 和NCBI Batch CD- search. (http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi).
EST 支持
Blast and Hmmer同时检测到
4、通过上述操作获得某家族的所有成员

http://www.ppmy.cn/news/654950.html

相关文章

易基因|14种全基因组DNA甲基化测序(WGBS)标准分析比对软件的比较| 生信专区

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 全基因组重亚硫酸盐测序(WGBS)是甲基化研究的重要技术。尽管已经开发了一系列工具来解决由亚硫酸盐处理引起的比对问题,但尚未对最新可用工具的reads比…

GWAS全基因组关联分析工具GAPIT最新版的安装教程与报错解决方案

GWAS工具GAPIT最新版 本篇笔记主要内容是GWAS分析软件GAPIT最新版的安装和使用教程,包括常见的报错以及解决方案,主要出错位置在LDheatmap、stringi、nloptr、lme4等,测试安装的环境是东方天意的ECS云服务器(Linux centos7&#x…

GWAs——全基因组关联分析二(质控2)

接上文GWAs——全基因组关联分析(质控1),此数据集模拟的是祖先来自欧洲西北部的犹他州居民,所以需要将没有欧洲背景的个体从数据集中剔除,即控制群体结构(Population Stratification,群体分层)。 一、控制群体结构 1、创建工作目录 不同于教程的目录结构,为了和文章…

从基因来看腾讯

经常在网上看到大家在谈腾讯,而且大部分都是负面的,一会儿说腾讯抄别人东西,一会儿又说腾讯打压小公司,但基本看到的都是抱怨,没人分析过其中原因,当然,商业因素也是其中之一,但我要…

GWAs——全基因组关联分析流程

GWAs(Genome Wide Association studies,全基因组关联分析),即通过对群体的SNPs数据(genetic marker)和表型间的关联分析,目前常用于遗传病学研究、基因功能验证、目的基因筛选等方面的研究。GWAs分析总体流程较为复杂,包括诸多数据准备和过滤工作,其大体流程(不包括二…

GWAs——全基因组关联分析(质控1)

数据质控、质检是所有生信分析必不可少的步骤,GWAs分析的质控大抵可分为7个步骤:控制检出率(Missing)、剔除性别错误(Sex Discrepancy)、控制次等位基因频率(MAF)、去除反哈达——温…

基因检测企业介绍

网上查阅公司时,找到了一份咨询公司做的企业排行,感觉跟行业内实际情况相对符合(提到的相对来说),转载以供后来人参考。 这里面的公司类型是不同的,不要太关注企业的排行。比如华大基因确实是是综合解决方案…

【生信】初探基因定位和全基因组关联分析

初探QTL和GWAS 文章目录 初探QTL和GWAS实验目的实验内容实验题目第一题:玉米MAGIC群体的QTL分析第二题:TASSEL自带数据集的关联分析 实验过程玉米MAGIC群体的QTL分析① 包含的数据② 绘制LOD曲线株高对应的QTL TASSEL自带数据集的关联分析TASSEL简介实际…