文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

生物组学数据的集成特征选择研究

收藏

导　　师： 谢维信

授予学位： 博士

作　　者： ;

机构地区： 深圳大学

摘　　要： 高通量技术的发展产生了大量与基因、蛋白质和代谢相关的生物组学数据。从生物组学数据中发现和提炼与疾病相关的信息一直是生物信息学领域的热点问题。通过模式识别中的特征选择和分类技术,对高维生物组学数据中蕴藏的重要信息进行提取、筛选、识别和分类是分析生物组学数据的常用方法。生物组学数据具有的高维小样本、多类间样本分布不平衡等多种特征和样本统计分布特性,对特征选择算法在分类泛化性和稳定性等方面的表现提出巨大挑战,为了精确和稳定地提取与分类目标高度相关的特征子集,需要我们深入地研究和设计针对生物组学数据特征选择问题的新方法。本文针对生物组学数据的不同特性,提出了一系列集成特征选择算法,主要工作概括如下:1.在研究多种特征相关性度量的基础上,提出一种基于多种相关性度量的集成最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)特征选择算法。我们分析了最大信息系数、皮尔逊相关系数和互信息量在特征相关性度量方面的差异,并对前向搜索算法进行改进,增加可以设置所选择特征个数和搜索范围的机制,基于3种特征相关性度量和改进的搜索算法获得三组最优特征子集并进行集成分类学习。对不同类型的多组生物组学数据集的分类对比实验结果表明,集成m RMR特征选择算法能够针对各种类型的生物组学数据有效地选择最优特征子集,并有助于分类算法获得良好的识别性能。2.针对生物组学数据普遍存在多个最优或次优特征子集的情况,提出基于小生境二进制粒子群优化的集成特征选择算法。基于单一特征子集构建的分类模型在小样本生物组学数据上容易产生过拟合而影响分类泛化性能。为了尽量避免该问题,本文通过小生境二进制粒子群优化算法作为特征子集搜索算法,获得多�

关键词： 生物组学数据分类粒子群优化算法特征选择模型选择

领　　域： [] []

相关机构对象

机构五邑大学经济管理学院: 作者数：256; 发文主题：牧民,商业街,供应链管理,影响因素,企业财务,预期收益率,客户关系管理,财务分析,低碳经济,本科教学研究,股东财富最大化,应付账款,现金,企业,资金互助社,政府,地下商城,营业利润,营销策略研究,便利店,分销渠道管理,企业可持续发展,项目实训,牧户,有机食品,资本成本,农村连锁经营,实证研究,烘焙食品,综合教学模式,风险管理策略,低碳消费,经营环境,营销管理理论,相机,资金筹集,商业银行,跨国经营,格力电器,理财理念,竞争优势,营销策略,综合实训,核心能力,市场营销,零售业,金融融资,港澳,品牌形象,日本,企业营销,融资渠道,零售业态,分销系统,特色教学,地方院校,感知风险,农村金融,

机构中共韶关市委党校: 作者数：112; 发文主题：实事求是,政府信任,个案考察,社会主义,党性党风党纪,对接,基层政权,大学生就业,转变经济发展方式,中国社会,公民参与,历史探索,道德信仰危机,道德,领导干部,道德观,执政成本,战略思维,政府回应力,舆论氛围,社会学,生态文明,纯洁性,党政机关,共产党员,执政理念,逻辑,政府治理转型,科学发展观,人民公社化运动,惩防腐败,群众工作,政府,发挥先锋模范作用,道德教育,政府决策,党组织生活,十七届六中全会,毛泽东,中国共产党,善治,阳光工程,大跃进,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构华南理工大学工商管理学院: 作者数：3266; 发文主题：统计量,随机前沿模型,农村劳动力迁移,随机前沿分析,管理层激励,实证研究,公司绩效,经济增长,抑价,产权性质,知识溢出效应,企业业绩,融资约束,实证分析,融资困境,商业银行,模拟,企业税负,知识外溢,中小企业,增长极,上市公司,融资决策,空间计量模型,并购绩效,企业研发投入,有效性,外商直接投资,成本控制,收敛,投资者法律保护,股权性质,农村劳动力,方法,企业,技术创新,认股权证,国有企业,技术并购,资本结构,股权激励,面板数据,政府干预,指标体系,公司治理,并购,

机构华南理工大学经济与贸易学院: 作者数：1252; 发文主题：金融理论,资产负债表,金融脱媒,公司特质信息,经济增长,现代金融体系,多元化经营,资产证券化,金融危机,中国城镇居民,融资模式,供应链协调,金融监管,风险偏好,中央银行,政治经济学,上市公司,流动性,系统性风险,预防性储蓄动机,货币政策,资本市场,资本项目开放,金融体系,粤商,中国股市,技术创新,风险厌恶,碳排放量,资本结构,财政分权,同业业务,农产品供应链,政府干预,特异性表达,提前期,实证研究,突发事件,融资约束,次贷危机,商业银行,遗传算法,银证合作,公共品供给,报童模型,信息不对称,收益共享,银行同业,整数规划,供应链金融,收益共享契约,可追溯系统,供应链,金融稳定,政府偏好,公司治理,乳制品供应链,农产品配送,

生物组学数据的集成特征选择研究

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

生物组学数据的集成特征选择研究

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+