帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

脊椎动物基因注释中的大基因问题
Vertebrate Gene Predictions and the Problem of Large Genes

作  者: ; ; ; ; ; ; ; ;

机构地区: 浙江大学

出  处: 《世界科技研究与发展》 2003年第6期42-50,共9页

摘  要: 为了找出编码蛋白质的基因,注释流程结合了“从头开始的基因预测方法”和“与已知基因相似性比较”这两种方法。“从头开始的基因预测方法”虽然有很高的假阳性但是假阴性却很低;相形之下,结合了相似性比对的方法之后虽然能够降低假阳性,但是却大大提高了假阴性。我们发现,在这当中与基因预测正确率相关的最重要因素就是基因大小(包括内含子在内)——大基因尤其容易产生预测错误。 To find unknown protein-coding genes, annotation pipelines use a combination of ab initio gene prediction and similarity to experimentally confirmed genes or proteins. Here, we show that although the ab initio predictions have an intrinsically high false-positive rate, they also have a consistently low false-negative rate. The incorporation of similarity information is meant to reduce the false-positive rate, but in doing so it increases the false-negative rate. The crucial variable is gene size {including introns) -genes of the most extreme sizes, especially very large genes, are most likely to be incorrectly predicted.

关 键 词: 脊椎动物 基因注释 编码蛋白质 假阳性 假阴性 基因预测 大基因

领  域: [生物学] [生物学]

相关作者

相关机构对象

相关领域作者

作者 丁培强
作者 徐松林
作者 徐枫
作者 陈光慧
作者 孙有发