帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基因序列拼接算法的研究

导  师: 张祖平

学科专业: H1202

授予学位: 硕士

作  者: ;

机构地区: 中南大学

摘  要: 生物信息学是一门综合利用生物学、计算机科学、数学等学科知识的新兴交叉学科,其主要任务是揭示海量生物学数据中蕴含的生物学意义、探索生命活动的奥秘。全基因组dna序列拼接是生物信息学研究的重要课题。在大规模dna测序中普遍使用的shotgun方法中,片段序列的拼接是一个关键而又费时的过程,其中包含了一些实际困难,重复子序列对片段间正确重叠的干扰就是其中一个。如何提高序列拼接的精度和速度是本课题研究的重点。 本文在深入分析现有拼接算法及其实现软件的基础上,针对分布式并行计算环境,提出了优化的dna序列拼接并行算法p assembler,分别对序列拼接中的overlap、layout和consensus阶段的串行处理过程和并行算法进行了探讨,通过分析数据集的划分方法和串行处理过程的可并行性,提出了多种不同的并行处理策略并加以比较与分析,理论和实验结果都验证了并行处理后序列拼接算法效率大大提高。除此之外,论文针对dna序列拼接中比较棘手的重复序列问题,提出了一种改进的基于k-mer子串的重复序列识别方法kmerrepeat,实验结果表明:和已有聚类和arachne分析方法相比,具有更高的精确性,也在一定程度上提高了序列拼接效率。 论文对算法的实现及其拼接软件的测试结果也作了深入的分析,实验结果表明算法是可行的且高效的。

关 键 词: 生物信息学 基因组 测序 序列拼接 并行处理

领  域: [自动化与计算机技术] [自动化与计算机技术] [生物学]

相关作者

作者 徐松林
作者 张朝彪

相关机构对象

机构 华南理工大学
机构 华南理工大学法学院
机构 济源职业技术学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊