2011-03-07 11:17:31| 分类: Bioinformatics | 标签: |举报 |字号大中小 订阅
事实上,在NCBI有很多种办法可以确定某个基因的外显子或者内含子,当然还有UTR区域。今天先介绍着一种,以后有必要再介绍其它的。通过Blast是一种办法,但不够直观,需要判断的条件要多一些,经验也需要多一些。如果条件允许的话,我们可以借助其它一些专门的软件,让事情变得容易。
今天我们来介绍NCBI的其中一个软件,Splign
网址:http://www.ncbi.nlm.nih.gov/sutils/splign (点击online,在线运行)
Splign - is a utility for computing cDNA-to-Genomic alignments based on a variation of the Needleman-Wunsch algorithm combined with Blast for compartment detection and greater performance.
Splign -通过mRNA或EST序列与所在的基因组序列比对,用于单个基因结构图(外显子内含子)显示, 用户每次只能提交一个基因序列。
1,在Gene数据库,填入基因名HNF-4,我一般的话习惯叫Symbol,每个基因都有个Symbol,即基因名。
2,我们来mouse的HNF4基因来作为今天的例子。Symbol会随着版本的升级而变化,当然,以前使用过的基因名也会保留着。而Symbol会对应一个GeneID,无论Symbol如何改变,GeneID是唯一的。这个ID是非常重要的。在这个页面,我们将看到HNF4基因的结构图,从图中给出的信息可以看出,HNF4基因有10个外显子。蓝色部分是UTR区,显示在5'端有一小段序列和3'端有一大段序列是UTR。
3,在HNF-4基因的RefSeq区域,我们将可以看到这个基因的参考序列,有mRNA和基因组的。这个区域不一定每个基因都有。NM_开头的序列都是参考序列。
4,接下来我们进入Splign的online界面(http://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=online&level=form),你可以通过mRNA和基因组的Accession或是它们Fasta格式的序列进行对比,要注意基因组的序列不要太长。推荐直接在下拉框选项里选择,一般常用的生物都在。
5,结果一目了然,10个外显子,而且还显示mRNA以及对应的基因组比对的序列,并且还可以知道某个外显子在mRNA序列上的区域。就连UTR区的序列也知道了。
结束。
感谢柳城,转自 http://liucheng.name/347/
评论