意见与建议
首页菲沙科研菲沙软件 > genBlast系列
详细信息

genBlast系列

日期:2016年1月27日 15:54

菲沙基因开发团队结合图形理论算法成功开发出基于同源基因的genBlast系列软件,包括genBlastAgenBlastG。这两个软件都在国际顶级基因组学和生物信息学刊物上发表并被广泛应用,genBlast系列软件旨在帮助客户高效准确地实现目标基因的查找与预测,从而将研究问题便捷化。

genBlastA

杂志Genome Research

研究背景

进行BLAST比对时,得到的结果是按照高分值片段对(HSPs)进行排序的列表,结果中含有大量候选基因片段,而并非我们想要的全长基因。用户真正感兴趣的HSPs被大量无用信息所掩盖,这使得BLAST的结果很容易使人感到困惑。开发genBlastA的目的就是为了高效利用BLAST比对结果。

过去几年里,也有一些用于HSPs筛选和分类的专项软件,这些软件或多或少存在一定的缺陷,其中最著名的软件是WU-BLASTWU-BLAST可以使HSPs相邻共线性显示,但当目的基因中存在大量串联基因簇时,WU-BLAST就会出错。此外,WU-BLAST也无法对多个旁系同源基因进行处理。另一个软件BLAST2GENE,是专门为解决多个旁系同源基因而开发,不过这个软件涉及到大量的阈值和矩阵,以致用户使用起来不方便。Cui2007年开发了ML,可以处理串联旁系同源基因,但是该软件依赖于物理算法进行分类。

query gene含有大量串联旁系同源基因时,对HSPs进行筛选和分组就变成一个十分具有挑战性的工作。与此同时我们需要知道的是,对已经测序的物种,很多基因组中都含有大量的串联旁系同源基因。因此,一个软件能够对含有串联基因簇的HSPs进行筛选和分组,是十分难得的。

研究方法

基于图论算法开发了genBlastA,可以根据预先定义好的规则,自动对BLAST比对HSPs结果进行分类。genBlastA的新颖之处在于用边长代表基因分类,每条最短路径对应一组HSPs,代表一组同源基因,从而将研究问题转化为寻找最短路径的数学问题。

研究结果

genBlastA的显着特点是,它不依赖于使用特设的阈值来过滤HSPs和靶基因之间的噪音,而是采用有向图对HSPs之间的关系进行建模,从而将HSPs的筛选和分类问题转化为有向图最短路径的搜寻问题。基于图论算法开发的genBlastA可以高效准确的识别同源序列,优于现有方法。

在处理串联重复基因时,genBlastA的表现优于MLWU-BLAST

代表单个基因的HSPs分组情况

 

genBlastG

杂志Bioinformatics

研究背景

BLAST用户往往希望通过序列比对获得同源基因信息,但用户进行BLAST比对后获得的是大量局部匹配HSPs(高分值片段对),而非用户感兴趣的部分。另一方面,目前大多数基于同源比对的软件使用的是计算密集型算法,没有充分利用最为广泛已经十分完善的BLAST,这是一个很大的遗憾。为此,我们基于BLASTHSPs构建了高效高精度的基因预测模型genBlastG

研究方法

过去数十年来,已经公布了很多基于同源基因预测软件,例如GeneWiseProjectorTwinScanExonerate等。这些软件的算法要么没有使用BLAST,要么只在预处理阶段涉及到BLAST。考虑到BLAST受众很广,我们尝试直接利用BLASTHSPs结果构建基因预测模型,从HSPs中提取和确定最佳的基因结构。genBlastG使用经genBlastA处理的HSPs作为输入,通过检查比对区域与相邻基因区域的起始/终止密码子和剪接信号,来定义基因模型。

研究结果

genBlastG充分利用了过去二十多年来BLAST比对软件在质量和速度方面快速发展的优势,依托于BLAST广泛的受众和高度稳定的特征构建高效基因预测模型。测试表明genBlastG的运算速度很快,在特异性和敏感性方面可以提供比以前算法更好的性能。

相比GeneWise(目前使用最广泛的基于同源的基因预测程序)和Exonerate(尤其是运行详尽模式时)而言,即使是与运行不太准确的启发式模式时的Exonerate相比较,genBlastG的运行速度依然更快。

genBlastGGeneWise运行时间比较

基因预测正确性评估

注:GBgenBlastGGWGeneWiseExoexonerateExo Heuheuristic exonerate

从图中可以看出,genBlastG基因预测准确性最高。

菲沙基因相关文献

1. She R, Chu JS, Wang K, Pei J, Chen N. GenBlastA: enabling BLAST to identify homologous gene sequences. Genome Res. 2009 Jan;19(1):143-9.

2. She R, Chu JS, Uyar B, Wang J, Wang K, Chen N. genBlastG: using BLAST searches to build homologous gene models. Bioinformatics. 2011 Aug 1;27(15):2141-3.

所属类别: 菲沙软件

该资讯的关键词为: