摘要:现今的药物研发工作所消耗的人力物力、时间和资金都变得越来越多,并且每年的申报名额也在逐年减少,药物研...现今的药物研发工作所消耗的人力物力、时间和资金都变得越来越多,并且每年的申报名额也在逐年减少,药物研发工作变得越来越难以开展。得益于前人的科研工作经验的总结和大数据化的数据交流的发展,人们逐渐倾向于寻找一种成本低、效率高的方法应用于药物的研发初期,为现有药物提供高置信度区间的潜在适应症,这种技术被称为药物重定位。虽然目前已有不少科研人员提出了极具研究价值的预测模型,然而,在药物相似性和疾病相似性的全面挖掘和科学利用等方面的技术,目前大多数药物重定位方法仍然缺乏。为了解决这些问题,本文提出了两个模型分别对其进行了探究,具体研究内容如下:(1)基于多重相似度挖掘的药物-疾病关联预测二分图扩散算法(BGMSDDA):第一步,采用加权K近邻(weighted K nearest known neighbors,WKNKN)算法重建药物-疾病关联矩阵;第二步,设计了一种融合线性邻域相似度和高斯核相似度的药物和疾病相似特征提取方法;第三步,使用二分图扩散算法来推断尚未发现的药物与疾病的关联。经过10次交叉验证实验,BGMSDDA在两个数据集上均表现出良好的性能,AUC分别为0.939±0.001(Fdataset)和0.954±0.001(Cdataset),AUPR分别为0.466±0.001(Fdataset)和0.565±0.001(Cdataset)。此外,为了评价BGMSDDA预测结果的准确性,我们从Fdataset和Cdataset中分别选取三种医用药物进行了案例研究,并利用一些数据库对每种药物的预测相关疾病进行了验证。基于所获得的结果,BGMSDDA被证明在预测药物-疾病相关性方面是有用的。(2)基于中心核对称多核学习的药物-疾病关联预测的压缩感知算法(DRPADC):第一步,对于原始矩阵的稀疏问题,利用WKNKN(weight K nearest known neighbors)算法对原始关联矩阵进行处理以降低关联矩阵的稀疏性;第二步,为了科学地利用各种相似性信息,通过中心核对称多核学习(C显示全部