文献详情 - Gdtheory理论粤军网|广东智库信息化平台

文献详细_{Journal detailed}

深度强化学习在图像辅助控制及图像分类中的应用研究

收藏

导　　师： 周伟英;金连文

授予学位： 硕士

作　　者： (）;

摘　　要： 近几年,深度学习和强化学习中一些先进方法的出现使得两者的结合成为可能,其产物就是深度强化学习。深度强化学习既有继承于深度学习的强泛化和自特征提取能力,又可以像强化学习方法一样,使智能系统通过自我的试错在给定环境中学习解决特定任务的策略。深度强化学习的诞生在人工智能领域影响重大,相关工作随之涌现,一些成功的深度强化学习算法甚至能够在游戏和机器控制中超过人类的表现。然而,现有的深度强化学习算法仍然存在一些不足和空白。在应用深度方面,现有算法无法在连续动作空间中进行多任务学习,并且大部分算法只能学习简单的任务。在应用广度方面,算法在计算机视觉领域中,特别是图像分类问题中的应用还非常少。本文介绍的就是从这两个方面出发,阐述对深度强化学习在图像辅助控制和图像分类问题中的应用研究。本文共提出三个算法,即multi-DDPG算法、h-DDPG算法和自强化网络算法,前两个用于实现连续动作空间中图像辅助下的多任务学习和层次性学习,后一个则针对图像分类问题。在multi-DDPG算法中有一个值网络和多个策略网络,其中每一个策略网络负责学习一个任务,而值网络则负责训练策略网络。在h-DDPG算法中,这个结构被扩展为一个具有两个值网络和多个策略网络的结构,增加的一个值网络可以通过组合策略网络的方式来进行复杂任务的学习。最后,自强化网络算法尝试将深度强化学习应用于图像分类问题中,算法中有一个特征决策智能系统,它控制着各个输入图像的分类时刻,对于还不能分类的图像,它会选择一种图像变换,并将变换后的图像返回给图像分类网络进行再次分类。实验结果显示,本文中提出的三个算法都在各自的任务中有着不错的性能。其中,multi-DDPG算法能够在多任务学习中学习到与单任务学�

关键词： 深度学习强化学习深度强化学习

领　　域： [] []

相关机构对象

机构中山大学: 作者数：27151; 发文主题：电视节目,用户,实证研究,家居,硬件,视域,异构,权利,分布式存储,蓝牙,启迪,从严治党,音乐门铃,领导干部,加密方法,中间件,党内权力,数字电视,权力监督,制度反腐,实体化,数字家庭,民主监督,社会主义国家执政党,马克思主义,监控系统,视频图像,中间件系统,数据传输方法,毛泽东,中国特色社会主义,风险评估,中国共产党,邓小平,素质教育,青年农民工,嵌入式,

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构华南师范大学物理与电信工程学院: 作者数：117; 发文主题：学年学分制,高校贫困生资助,自制教具,道德建设,完全学分制,物理新课,物理学史,学年制,物理实验教学,课标理念,教育实践,就业难问题,教育融合,广州大学城,资助管理,信息技术,分层教学,工作信息化,联系群众,教学资源库,政治信仰,双基,有效性,物理教学,物理实验,选课制,教育思想,新时期大学生,物理课程标准,校园文化建设,信仰现状,高中物理教学,家庭经济,多媒体技术,高校学生,中国大学生,中学物理,困难补助,素质教育理念,经济全球化,科学教育改革,教学观,教育体制改革,

机构肇庆学院图书馆: 作者数：78; 发文主题：高校酒店管理专业,德治传统,数据库建设,中国经济体制改革,图书馆,大学生思想政治教育,学科馆员,政府规制,数字化资源建设,指导力,政治经济学,人民内部矛盾,生产率理论,行政垄断,学科化服务,信息服务,致用,模块化教学,知识产权,政府职责,治国方略,共享理念,设计探讨,联合数字参考咨询,信息需求,邓小平,中国共产党,政府管制制度,政治理论课教学,资源共享,道德建设,重工业,网络环境,用户需求,实践教学内容,思想政治理论课,第三产业,社会责任感,模块式,信息资源建设,特色馆藏,和谐社会视野,自然垄断行业,政权,服务业,书目信息服务,特色数据库建设,影响高校,社会主义工业化,农业,收入分配制度,政治道德观,思想政治教育职能,自然垄断,毛泽东,地方院校,营销创新,政府调控,

机构华南师范大学政治与行政学院: 作者数：1117; 发文主题：荀子,城中村,陆王心学,非正式经济,西方哲学,自主性,心学,牟宗三,冯友兰,流动人口聚居区,经济发展,法家,社会学思考,社会现代化,后学,道德,韩非子,徐复观,社会学,性恶论,人性论,个案研究,社区建设,社会整合,治安,性恶,廉租屋,陆九渊,政府主导,儒家,性善论,市场经济体制,道德教育,张载哲学,陆学,城中村改造,孔子,城市化,陈荣捷,社会结构,政治思想,经济奇迹,中国哲学,社会资源,

深度强化学习在图像辅助控制及图像分类中的应用研究

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+

相关作者

相关机构对象

相关领域作者

深度强化学习在图像辅助控制及图像分类中的应用研究

参考文献 更多+

二级参考文献 更多+

引证文献 更多+

二级引证文献 更多+

同被引文献 更多+

耦合作品文献 更多+

相关文献 更多+

相关作者

相关机构对象

相关领域作者

参考文献更多+

二级参考文献更多+

引证文献更多+

二级引证文献更多+

同被引文献更多+

耦合作品文献更多+

相关文献更多+