gene structure prediction methods

基因预测的方法有很多。维基百科:http://en.wikipedia.org/wiki/List_of_gene_prediction_softwarehttp://www.geneprediction.org上提供了大量的基因预测的软件和指导书籍

以下介绍主要的真核生物基因预测的几个方法:

1. Augustus

AUGUSTUS ususally belongs to the most accurate programs for the species it is trained for. Often it is the most accurate ab initio program.

AUGUSTUS的发展很快,版本不断更新,功能越来越完善。AUGUSTUS能很好地结合RNA-seq数据得到的hints.gff进行基因预测。

2. GeneMark-ES

GeneMark-ES使用起来最简单,唯一的能以基因组自我训练出训练集用于基因预测。该软件不提供使用已有模型来预测基因。对应的使用模型的版本为GeneMark.hmm eukaryotic,但是能使用的模型太少,不提供其建模的方法。

3. FGENESH

FGENSH是商业软件,由Softberry公司负责维护和发布,用户只能联网小量使用。若需要大量使用或本地化运行,则需要付费。找了半天,官 网不提供软件的下载。使用网页版的FGENESH去进行基因组基本的基因预测,很长时间后返回错误:Request not processed 413 Request entity too large。

4. mGene[.web]

虽然是新近的软件,但是该软件现在还不成熟,使用不易。该软件精确度貌似较高,特别是在下线虫中,和Augustus差不多了。

5. SNAP

Ian Korf独自写了该软件,2004年发表在BMC Bioinformatics上,引用次数208.

该软件安装简单,软件说明较少,作者只是简单在README中提到怎么去建HMM的模型。

6. Glimmer[HMM]

使用Glimmerhmm,应该还不如使用SNAP。

7. geneid

geneid的training的文档中写得很是繁琐,不想看。

来源