帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

深度强化学习在图像辅助控制及图像分类中的应用研究

导  师: 周伟英;金连文

授予学位: 硕士

作  者: ();

机构地区: 华南理工大学

摘  要: 近几年,深度学习和强化学习中一些先进方法的出现使得两者的结合成为可能,其产物就是深度强化学习。深度强化学习既有继承于深度学习的强泛化和自特征提取能力,又可以像强化学习方法一样,使智能系统通过自我的试错在给定环境中学习解决特定任务的策略。深度强化学习的诞生在人工智能领域影响重大,相关工作随之涌现,一些成功的深度强化学习算法甚至能够在游戏和机器控制中超过人类的表现。然而,现有的深度强化学习算法仍然存在一些不足和空白。在应用深度方面,现有算法无法在连续动作空间中进行多任务学习,并且大部分算法只能学习简单的任务。在应用广度方面,算法在计算机视觉领域中,特别是图像分类问题中的应用还非常少。本文介绍的就是从这两个方面出发,阐述对深度强化学习在图像辅助控制和图像分类问题中的应用研究。本文共提出三个算法,即multi-DDPG算法、h-DDPG算法和自强化网络算法,前两个用于实现连续动作空间中图像辅助下的多任务学习和层次性学习,后一个则针对图像分类问题。在multi-DDPG算法中有一个值网络和多个策略网络,其中每一个策略网络负责学习一个任务,而值网络则负责训练策略网络。在h-DDPG算法中,这个结构被扩展为一个具有两个值网络和多个策略网络的结构,增加的一个值网络可以通过组合策略网络的方式来进行复杂任务的学习。最后,自强化网络算法尝试将深度强化学习应用于图像分类问题中,算法中有一个特征决策智能系统,它控制着各个输入图像的分类时刻,对于还不能分类的图像,它会选择一种图像变换,并将变换后的图像返回给图像分类网络进行再次分类。实验结果显示,本文中提出的三个算法都在各自的任务中有着不错的性能。其中,multi-DDPG算法能够在多任务学习中学习到与单任务学�

关 键 词: 深度学习 强化学习 深度强化学习

领  域: [] []

相关作者

作者 陈文涛
作者 肖海明
作者 王为理
作者 凌涛
作者 林俊斌

相关机构对象

机构 中山大学
机构 华南理工大学
机构 华南师范大学物理与电信工程学院
机构 肇庆学院图书馆
机构 华南师范大学政治与行政学院

相关领域作者