澳客彩票计划群

 
教育论文网

深度强化学习算法及应用研究

硕士博士毕业论文站内搜索    
分类1:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化基础理论论文人工智能理论论文自动推理、机器学习论文
分类2:教育论文网→工业技术论文→自动化技术、计算机技术论文自动化技术及设备论文机器人技术论文机器人论文
深度强化学习算法及应用研究
论文目录
 
摘要第1-7页
Abstract第7-9页
符号说明表第13-15页
第一章 绪论第15-24页
    1.1 研究背景和意义第15-16页
    1.2 强化学习研究现状第16-21页
        1.2.1 经典强化学习方法研究现状第17-19页
        1.2.2 深度强化学习方法研究现状第19-20页
        1.2.3 问题与挑战第20-21页
    1.3 本文主要工作第21-22页
    1.4 论文组织结构第22-23页
    1.5 本章小结第23-24页
第二章 强化学习的原理和常用算法概述第24-36页
    2.1 引言第24页
    2.2 强化学习的原理第24-31页
        2.2.1 SARSA算法第27-28页
        2.2.2 Q-learning算法第28-29页
        2.2.3 确定性策略梯度算法第29-31页
    2.3 深度强化学习原理第31-35页
        2.3.1 深度Q网络算法第31-33页
        2.3.2 双重深度Q网络算法第33页
        2.3.3 深度确定性策略梯度算法第33-35页
    2.4 本章小结第35-36页
第三章 基于在线策略的多步强化学习算法设计第36-55页
    3.1 引言第36-37页
    3.2 基于在线策略的多步强化学习算法第37-41页
        3.2.1 基于On-Policy的TD强化学习算法第37-38页
        3.2.2 基于On-Policy的多步强化学习算法第38-41页
    3.3 仿真实验及结果分析第41-53页
        3.3.1 猫捉老鼠问题第41-51页
        3.3.2 山地车爬坡问题第51-53页
    3.4 讨论第53-54页
    3.5 本章小结第54-55页
第四章 基于离线策略的多步深度强化学习算法设计第51-70页
    4.1 引言第55-56页
    4.2 基于离线策略的多步深度强化学习算法第56-60页
        4.2.1 基于Off-Policy的TD强化学习算法第56-57页
        4.2.2 基于Off-Policy的多步强化学习算法第57-59页
        4.2.3 多步深度强化学习算法第59-60页
    4.3 仿真实验及结果分析第60-69页
        4.3.1 仿真实验平台设计第60-63页
        4.3.2 仿真实验参数设置第63页
        4.3.3 实验数据分析第63-65页
        4.3.4 算法扩展性分析第65-69页
    4.4 讨论第69页
    4.5 本章小结第69-70页
第五章 基于动态运动基元的深度强化学习算法设计第70-95页
    5.1 引言第70-71页
    5.2 基于动态运动基元的深度强化学习算法第71-83页
        5.2.1 分层动态运动基元框架结构设计第71-73页
        5.2.2 低级控制器学习层次结构第73-80页
        5.2.3 高级策略学习层次结构第80-83页
    5.3 仿真实验及结果分析第83-91页
        5.3.1 仿真实验平台设计第85-86页
        5.3.2 仿真实验参数设置第86页
        5.3.3 实验结果分析第86-91页
    5.4 讨论第91-93页
    5.5 本章小结第93-95页
第六章 总结与展望第95-98页
    6.1 论文工作总结第95-96页
    6.2 未来工作展望第96-98页
附录1第98-101页
附录2第101-102页
参考文献第102-114页
攻读博士学位期间取得的研究成果第114-115页
致谢第115-117页
附件第117页

本篇论文共117页,点击这进入下载页面
 
更多论文
深度强化学习算法及应用研究
基于分数阶的变分光流模型算法研究
柔性海洋立管系统振动控制研究
数据驱动的信息物理系统攻击策略及
供应商环保创新决策机制研究
法治背景下少数民族习惯法价值研究
负载型的镍改性碳化钼催化剂上甲烷
Nb2O5/SBA-
语义Web教育信息融合服务研究与实践
高性能SAPO-34分子筛的合成及其甲醇
金属改性对g-C3N4
石墨相氮化碳非金属光催化剂制备新
细菌辅助合成介孔分子筛及其在光催
Bi2WO6基负
新杂多酸型离子液体盐的合成、应用
甲醇水蒸气重整制氢水滑石衍生催化
少数民族习惯司法适用实证研究——
城市森林的结构特征及其生态环境服
生物炭固定化微生物对石油烃污染土
家庭经济资本影响农村子女教育获得
《油气生产手册》(节选)英汉翻译
β-环糊精聚合物对双酚酸的吸附性能
β-环糊精磁性材料对双酚S的吸附性
废FCC催化剂吸附水溶液中的双酚类化
过渡金属氮化物基催化材料的制备及
Ag-Cu催化剂选择性催化氧化氨性能研
限域空间构筑氮化碳基材料及其性能
改性HZSM-5甲醇芳构化催化剂研究
石墨烯负载贵金属加氢脱芳催化剂研
糠醇催化加氢反应工艺的研究
耐碱性阴离子交换膜的制备
改性TiO2/ZSM-5光催化氧
石墨相氮化碳(g-C3N
石墨相氮化碳的改性及光催化降解罗
钒酸铋复合材料的制备及性能研究
Ag基纳米材料催化4-硝基苯酚还原性
过渡金属(Mo,Ni和Co)磷化物制备方
基于冠醚接枝改性聚合物构筑阴离子
稀土掺杂TiO2-SiO
沈抚新城空间管制区划研究
甘肃秦安县郭嘉方言语音研究
抚顺油页岩热解及催化热解研究
焦油渣固化―干馏热解工艺研究
病毒传播过程的建模研究
手术麻醉管理系统设计与实现
社区管理系统的研究与实现
重整生成油脱烯烃技术的工业应用研
输油管道多相流冲刷磨损数值模拟研
悬链线立管气液两相流流动特性及控
基于Unity3D的交互式虚拟油库培训系
输气管道仿生肋条湍流减阻特性数值
海洋立管气液两相流规律分析
燃气电厂烟气与LNG冷能综合利用技术
工业烟气干法脱硫关键技术基础研究
α-Fe2O3
基于调控一体D5000系统动态监视可视
低共熔溶剂负载型催化剂氧化脱硫性
臭氧氧化催化裂化柴油脱硫工艺研究
双金属改性SBA-15的制备及其苄基化
炭基固体酸催化酯化反应合成生物柴
介孔分子筛脱硫吸附剂高分散Lewis酸
钒酸铋改性SBA-15可见光催化氧化脱
燃料电池用N杂环碱性阴离子交换膜的
负载型催化剂的制备及氧化脱硫性能
钨酸铜系列光催化氧化脱硫催化剂
氧化钨表面调控工艺及光催化性能研
多级孔Hβ分子筛的改性及催化苯甲醚
改性固体超强酸用于汽油氧化脱硫的
副品红新工艺及下游产品开发
 
版权申明:目录由用户o9303**提供,cdruiyu.com仅收录目录,作者需要删除这篇论文目录请点击这里。
版权所有 教育论文网 Copyright(C) All Rights Reserved
快赢彩票计划群 98彩票计划群 趣彩彩票计划群 博乐彩票计划群 云鼎彩票计划群 澳彩网彩票计划群