文献详情 - Gdtheory理论粤军网|广东智库信息化平台

全部文献媒体文章报刊论文会议论文学位论文出版专著研究报告课题成果特色专题

高级检索

您现在所在的位置：网站首页 > 知识中心 > 文献详情

文献详细_{Journal detailed}

基于增强学习的平行机调度研究
Parallel machines scheduling with reinforcement learning

下载全文在线阅读

收藏

作　　者： ; ; (翁小华）;

机构地区： 清华大学机械工程学院工业工程系

出　　处： 《计算机集成制造系统》 2007年第1期110-116,共7页

摘　　要： 尝试运用增强学习方法来研究平行机调度问题,通过定义系统状态、行为和报酬函数,把调度问题转化为平均报酬型半马尔可夫决策过程,并使用结合函数泛化器的R-Learning算法来解决。提出排名算法,并利用它和两种常用的调度规则(最短期望加工时间规则和先进先出规则)来定义增强学习的行为。实验结果表明,R-Learning算法通过仿真实验学习较优的调度策略,在不同的决策状态下选择最优或次优的行为,对每个测试问题的效果都优于以上任何一条调度规则。 A Reinforcement Learning （RL） method, R-Learning, was used to study parallel machines scheduling problems which was aimed to minimize mean flow time of jobs. The scheduling problem was converted into Semi-Markov Decision Process（SMDP） by defining system state, actions and reward function. It was solved by R- Learning functions. A heuristic, Ranking Algorithm （RA） was proposed and defined as RL as well as two commonly used dispatching rules： Shortest Expected Processing Time （SEPT） and First In First Out （FIFO）. Experiment results demonstrated that R-Learning could learn a near-optimal scheduling policy through simulation, i.e. to select optimal or sub-optimal actions at different states. The conclusion was that R-Learning was superior to the above heuristic rules in all test problems.

关键词： 调度平行机增强学习马尔可夫决策过程

领　　域： [理学] [理学]

相关作者

作者谭嘉欣: 作品数：1被引量：0; 供职机构：华南理工大学工商管理学院; 发文主题：知识转移;调度研究;项目调度;多目标决策

作者杜凤兵: 作品数：1被引量：0; 供职机构：华南理工大学; 发文主题：企业管理;调度研究;车间调度

作者莫赞: 作品数：57被引量：279; 供职机构：广东工业大学; 发文主题：教学模式;智能教学系统;现代远程教育;面向对象;信息推荐;远程教育;数据挖掘;投饵;情景化;调度研究;资源调度;网格资源;协同过滤;信管专业;教师模型;信息系统;多智能体系统;高校经济管理;移动营销

作者罗承宁: 作品数：2被引量：1; 供职机构：华南理工大学; 发文主题：优化调度;调度研究;外国文学教学;建筑策划;教学方法;教学环境;教学内容;高校外语专业;法;大学教室

作者熊小龙: 作品数：1被引量：0; 供职机构：东莞理工学院机械工程学院; 发文主题：调度研究;资源约束;项目调度

相关机构对象

机构华南理工大学: 作者数：19075; 发文主题：模型,甲烷,订单农业,协商模型,零售商,供应链管理,绩效关系,供应链协调,制造商,催化剂,知识创新,关系承诺,利益分配,变质性物品,企业,技术创新,虚拟企业,知识分享,供应链协调模型,订货量,石墨烯,研究生教育,可控提前期,时变需求,实证研究,价格折扣,管理创新,信息共享,运营绩效,战略管理,货栈,协整关系研究,滞后支付,创新绩效,库存路径问题,订购,报童模型,信息不对称,创新型企业,销售商,内向型,博弈,甲醇电氧化,创新管理,直接甲醇燃料电池,外向型,智慧城市,风险规避,生命周期,车辆路径问题,供应链协作,供应链,员工创新行为,协整检验,动态面板,共性技术,德行领导,

机构佛山科学技术学院: 作者数：1259; 发文主题：构建和谐社会,引领社会思潮,中共中央,潜人才,道德建设,大学生综合素质,学校德育,整合课程,大学生健康,知识分子政策,院校培养,应用型人才,课程研制,应用型本科人才,德育,信息技术,时代呼唤,高校,大学生廉洁教育,支持者,学校生态,质量保障体系,教学活动设计,中国教师教育,青年文化,教学设计,知识分子工作,德育观,高校治理结构,道德教育,职员制改革,教育方法,智能教学,历史轨迹,大学生,地方院校,邓小平,中国共产党,共产党,

机构华南理工大学工商管理学院: 作者数：3266; 发文主题：统计量,随机前沿模型,农村劳动力迁移,随机前沿分析,管理层激励,实证研究,公司绩效,经济增长,抑价,产权性质,知识溢出效应,企业业绩,融资约束,实证分析,融资困境,商业银行,模拟,企业税负,知识外溢,中小企业,增长极,上市公司,融资决策,空间计量模型,并购绩效,企业研发投入,有效性,外商直接投资,成本控制,收敛,投资者法律保护,股权性质,农村劳动力,方法,企业,技术创新,认股权证,国有企业,技术并购,资本结构,股权激励,面板数据,政府干预,指标体系,公司治理,并购,

机构广东工业大学: 作者数：3693; 发文主题：物流服务,生态位,技术生态位,颠覆性创新,绩效关系,消费需求不足,机会主义,环境动态性,物流业,探索式学习,产业技术创新战略联盟,制造业服务化,招标书,突变级数法,企业,技术创新,能力,政府科技投入,第三方物流供应商,中介效应,创业导向,物流发展,企业竞争优势,物流成本,实证研究,动态环境,战略联盟,第三方物流,全要素生产率,管理理论,组织柔性化,实证分析,管理研究,时间节奏,物流市场,竞争优势,分析方法,企业管理,激励机制,博弈,时间序列分析,企业绩效,珠三角制造业,博弈分析,物流产业,利用式学习,企业文化,物流标准化建设,珠三角,一带一路,协同创新,制造业,区域品牌,组织学习,营销团队建设,

机构东莞理工学院机械工程学院: 作者数：19; 发文主题：现场管理,管理,物联网,电泳涂装,

相关领域作者

作者刘广平: 作品数：6被引量：1; 供职机构：广东岭南职业技术学院; 发文主题：积分运算;导数;知识基础;体质测评;体质健康;欧拉公式;代数余子式;定积分;定理;线性代数教学;线性方程组;阶梯形;解法;教学初探;高职大学生;行列式

作者彭刚: 作品数：11被引量：1; 供职机构：广东岭南职业技术学院; 发文主题：积分运算;周期解;环绕定理;泛函差分方程;次调和解;导数;知识基础;山路引理;体质测评;体质健康;欧拉公式;代数余子式;定积分;定理;动力系统;线性代数教学;线性方程组;阶梯形;解法;经济数学

作者杨科: 作品数：1被引量：0; 供职机构：华南理工大学; 发文主题：农产品期货市场;稀疏度;已实现波动率

作者陈艺云: 作品数：18被引量：46; 供职机构：华南理工大学; 发文主题：电子货币;违约概率;违约强度;系统性金融风险;金融体系;供应链金融;公司债;巴塞尔协议;银行;银行电子化;银行资本;隐私保护;预算软约束;预先承诺制;证券市场;知识差距;融资选择;市场化;市场经济;投资者投资行为

作者崔淑慧: 作品数：5被引量：4; 供职机构：华南理工大学; 发文主题：入学教育;声压级;文化教育;留学生;留学生汉语;留学预科;教育管理;教育培养模式;教育探讨;来华留学生;混响时间;教学评估;汉语语言清晰度;高等教育;高校留学生;案例分析;言语识别

联系方式

电话：020-38800179

邮箱：gdtheory@126.com

地址：广州市天河区天河北路618号广东社会科学中心

邮编：510635

友情链接

扫一扫手机浏览

广东省社会科学院·广东省哲学社会科学数据库·广东智库版权所有 Copyright©2012 gdtheory.cn All Rights Reserved.

违法和不良信息举报中心举报邮箱：jubao@cqvip.com 粤ICP备10080020号-3