帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于拉普拉斯正则化稀疏匹配模型的组学数据关联关系发现

导  师: 蔡宏民

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 随着生物信息技术的发展,高通量测序技术的出现极大地降低了测序的成本,提高了测序的性能,使得高效全面地测定同一样本不同层面的组学数据成为可能。目前已积累的海量多源异构生物医学数据奠定了整合分析多组学数据的基础,为揭示肿瘤发生发展的机理提供了的前所未有的机遇。但是由于数据中的噪声成分较大以及个体之间的差异性等因素,如何高效准确地识别多组学数据间的关联关系仍然是一个有待解决的问题。虽然现有模型在组学数据关联关系分析中取得了不错的进展,但仍存在一些不足之处。例如,大部分研究都仅仅聚焦于组学数据本身的分析,很少考虑在模型中加入其他重要的先验信息,甚至完全没有利用任何先验信息,但一些研究表明对先验信息的合理利用不仅可以提高模型准确性和健壮性,还可以提高运算效率。另外,越来越多生物分子之间的潜在关联已被证实,如基因调控网络、蛋白质-蛋白质相互作用网络和代谢路径网络等等。基于此,本文的主要内容如下:首先,本文简要地阐明了组学数据关联关系发现的研究背景、现状和意义。其次,本文简单地介绍了组学数据的获取方法与预处理方式。随后,本文对拉普拉斯矩阵的特性作简要的介绍。进一步地,本文基于组学数据关联关系的特点,为多组学数据关联关系的发现提出了拉普拉斯正则化稀疏匹配模型LRSM,该模型通过拉普拉斯正则项结合已有的先验信息对组学数据进行分析,挖掘数据中的潜在关联关系。此外,模型引入了L0-范数来对结果的稀疏性进行约束,最终可转化为带不等式约束的二次凸优化问题,并采用增广拉格朗日乘子法结合随机梯度下降法进行高效求解。最后,我们在模拟数据集和真实数据集上对拉普拉斯稀疏匹配模型进行测试,通过与现有方法进行比较分析证明了模型的

关 键 词: 组学数据 关联关系 拉普拉斯正则化 稀疏 凸优化

领  域: []

相关作者

作者 褚东伟
作者 万少飞

相关机构对象

机构 广东外语外贸大学
机构 广东工业大学

相关领域作者