一、基本分析内容
数据库检索与成员鉴定
进化树构建
保守domain和motif分析.
基因结构分析.
转录组或荧光定量表达分析.
二、数据库检索与成员鉴定
1、数据库检索
1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了
Brachypodiumdb:http://www.brachypodium.org/
TAIR:http://www.arabidopsis.org/
Rice Genome Annotation Project :http://rice.plantbiology.msu.edu/.
Phytozome:http://www.phytozome.net/
Ensemble:http://ensembl.gramene.org/genome_browser/index.html
NCBI基因组数据库:http://www.ncbi.nlm.nih.gov/assembly/?term=
2)已鉴定的家族成员获取。
如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:
a. NCBI: nucleotide and protein db.
b. EBI: http://www.ebi.ac.uk/.
c. UniProtKB:http://www.uniprot.org/uniprot/
2、比对工具。一般使用blast和hmmer,具体使用命令如下:
本地BLAST比对:formatdb–i db.fas–p F/T;
blastall–p blastp(orelse) –i known.fas–d db.fas–m 8 –b 2(or else) –e 1e-5 –o alignresult.txt.
-b:output two different members in subject sequences (db).
oHmmer (hidden Markov Model) search. Thesame as PSI-BLAST in function. It has a higher sensitivity, but the speed islower.
Command:
hmmbuild--informatafaknown.hmmalignknown.fa;
hmmsearchknown.hmmdb.fas>align.out.
3、过滤。
Identity: 至少50%.
Cover region: 也要超过50%或者蛋白结构域的长度.
domain: 必须要有完整的该蛋白家族的。工具pfamdb (http://pfam.sanger.ac.uk/) 和NCBI Batch CD- search. (http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi).
EST 支持
Blast and Hmmer同时检测到
4、通过上述操作获得某家族的所有成员
数据库检索与成员鉴定
进化树构建
保守domain和motif分析.
基因结构分析.
转录组或荧光定量表达分析.
二、数据库检索与成员鉴定
1、数据库检索
1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了
Brachypodiumdb:http://www.brachypodium.org/
TAIR:http://www.arabidopsis.org/
Rice Genome Annotation Project :http://rice.plantbiology.msu.edu/.
Phytozome:http://www.phytozome.net/
Ensemble:http://ensembl.gramene.org/genome_browser/index.html
NCBI基因组数据库:http://www.ncbi.nlm.nih.gov/assembly/?term=
2)已鉴定的家族成员获取。
如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:
a. NCBI: nucleotide and protein db.
b. EBI: http://www.ebi.ac.uk/.
c. UniProtKB:http://www.uniprot.org/uniprot/
2、比对工具。一般使用blast和hmmer,具体使用命令如下:
本地BLAST比对:formatdb–i db.fas–p F/T;
blastall–p blastp(orelse) –i known.fas–d db.fas–m 8 –b 2(or else) –e 1e-5 –o alignresult.txt.
-b:output two different members in subject sequences (db).
oHmmer (hidden Markov Model) search. Thesame as PSI-BLAST in function. It has a higher sensitivity, but the speed islower.
Command:
hmmbuild--informatafaknown.hmmalignknown.fa;
hmmsearchknown.hmmdb.fas>align.out.
3、过滤。
Identity: 至少50%.
Cover region: 也要超过50%或者蛋白结构域的长度.
domain: 必须要有完整的该蛋白家族的。工具pfamdb (http://pfam.sanger.ac.uk/) 和NCBI Batch CD- search. (http://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi).
EST 支持
Blast and Hmmer同时检测到
4、通过上述操作获得某家族的所有成员