导 师: 高建华
学科专业: H1203
授予学位: 硕士
作 者: ;
机构地区: 上海师范大学
摘 要: 本文将数据挖掘技术中被广泛使用的决策树方法运用到蛋白质组学的研究中,在搜集的大量关于模式生物酿酒酵母的原始数据基础上,用决策树方法对任意一对酿酒酵母蛋白是否构成蛋白质复合物进行预测.在单棵决策树的基础上本文构造了由多棵独立的决策树所组成的决策林(DECISION FOREST)系统,本文还利用已有的软件包生成了支持向量机(SUPPORT VECTOR MACHINE:SVM)系统,用同样的训练数据构造上述三种系统并对同样的测试数据进行分类预测,将三种方法的预测结果进行了比较和分析.最后本文对预测结果从生物学意义进行分析,阐述了这个方法对于酵母蛋白质复合物的进一步研究所具有的理论价值.
关 键 词: 生物信息学 决策树 决策林 支持向量机 蛋白质复合物 数据挖掘 酵母蛋白质
分 类 号: [TP311.13 TS261.1]