帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

单细胞测序数据的噪音分析及拷贝数检测算法研究

导  师: 蔡宏民; 王鹏

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 拷贝数变异是由基因组发生重排而导致,一般指长度为1 kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。拷贝数变异是基因组结构变异的重要组成部分,其变异率远高于SNP,是人类疾病的重要致病因素之一。传统上检测拷贝数变异的技术有比较基因组杂交及荧光原位杂交等,但这些技术都因其分辨率有限、或通量小、成本高等问题而在实际应用中受到限制。于2005年诞生的高通量测序技术以其通量高、总体成本低、信息产出高等突出优点,迅速应用于生命科学研究的各个领域,如de-novo测序、RNA测序、表观遗传学等。在单细胞测序技术面世以前,高通量测序技术主要用于组织测序,即对多个细胞测序,其忽略了细胞基因组间的异质性,测序结果为多个细胞的平均结果。随着单细胞测序技术的到来,对单个细胞的拷贝数变异进行检测成为可能。单细胞测序是对单个细胞的DNA或RNA进行测序,能够揭示单个细胞的基因表达状态和基因组变异概况,可反映细胞间的异质性,其在肿瘤、发育生物学、神经科学等领域的研究发挥巨大重用。单细胞测序技术主要包含单个细胞分离、全基因组扩增、测序文库构建及测序这三大部分,其与传统组织测序的主要区别在于全基因组扩增过程,该过程带来扩增偏倚、覆盖度等问题,使得单细胞测序结果有不同于组织测序的噪音。本文首先介绍拷贝数变异及其检测技术,接着介绍测序数据的预处理,以及对单细胞测序数据的噪音进行分析,最后针对单细胞测序数据的特性提出拷贝数变异检测模型,并通过实验评估。该模型使用负二项分布对测序数据的读深度信号进行建模,引入平滑性和稀疏性的限制,把拷贝数变异检测问题转换为二次优化问题,并基于交替方向最小化方法进行模型求解。经实验验证,对于

关 键 词: 拷贝数变异 负二项分布 二次优化 平滑性 稀疏性

领  域: []

相关作者

相关机构对象

相关领域作者