您好,欢迎访问太原理工大学学报| 收藏本站
主管单位:山西省教育厅
主办单位:太原理工大学
出版单位:《太原理工大
    学学报》编辑部
主  编:孙宏斌
副主编:郝晓刚(常务) 
    董晓强  冯增朝
    秦文萍  王 莉
    熊晓燕  晏 泓
    赵敬伟  贾丽红
编辑部主任:贾丽红
国内发行:太原市邮政局
     报刊发行局
国外发行:中国国际图书
     贸易总公司
邮发代号:22-27
CN:14-1220/N
ISSN:1007-9432
您当前的位置: 首页 > 论文 >  优先出版
引用本文:
  • PDF点击下载   大小: 1010KB   浏览:101   下载:731
  • 深度强化学习局部策略迁移方法

    DOI:
     10.16355/j.tyut.1007-9432.20230016
    摘要:
    强化学习策略迁移是一条降低深度强化学习训练消耗的有效途径,其中,局部策略迁移是在较小粒度上实现策略的迁移,它对整体策略性能的提升和策略灵活组合形成新整体策略有重要意义。但当今大多策略迁移研究聚焦于研究整体策略迁移,研究局部策略迁移的相对较少,对此本文提出了深度强化学习局部策略迁移方法。该方法借鉴了软件工程中“高内聚,低耦合”的思想,通过对作为策略载体的神经网络进行划分,使得不同子神经网络承载不同局部策略,然后通过对子神经网络的迁移,实现局部策略迁移,该方法支持局部策略灵活替换和组合,形成性能更优秀和适应新环境的新总策略。本文选取经典深度强化学习算法DQN作为实验算法,对比DQN算法使用本文方法前后的迁移能力和表现性能。结果表明,DQN算法使用本文方法后实现了局部策略迁移的同时还提升了约27.5%表现性能。
    关键字:
     深度强化学习;局部策略迁移;DQN

    网站版权:《太原理工大学学报》编辑部;您是本站第59204访问者

    地址:太原市迎泽西大街79号,邮编:030024;电话:0351-6111188,6014376 ,6014556