Angry Csr

  • Home
  • About me
  • Blog
  • GuildWar2
Welcome to my HomePage!!
  1. 首页
  2. 学习记录
  3. 正文

强化学习笔记(6)无模型控制

2022年3月18日 2853点热度 0人点赞 0条评论

手写笔记:

IMG_2158(20220318-194004).JPG

IMG_2160(20220318-194004).JPG

IMG_2159(20220318-194004).JPG

IMG_2161(20220318-194004).JPG

IMG_2163(20220318-194005).JPG

IMG_2162(20220318-194005).JPG

IMG_2164(20220318-194005).JPG

IMG_2165(20220318-194005).JPG

IMG_2166(20220318-194005).JPG

小结:至此,RL的基本理论已经全部结束,David Sliver的课程结构安排我认为十分合理,听完之后,整个强化学习的基本框架已经掌握了,概念基本清晰,剩下            就是不断地加深理解和实践了。

标签: policy-based learning Q-learning
最后更新:2022年4月26日

愤怒的叉烧肉丶

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

取消回复
最近评论
分类
  • Blog / 36篇
  • GuildWar2 / 1篇
  • 卡尔曼滤波与组合导航原理 / 13篇
  • 学习记录 / 72篇
  • 工程流体力学基础 / 3篇
  • 强化学习 / 23篇
  • 机器学习 / 10篇
  • 深度学习与神经网络 / 7篇
  • 鲁棒控制 / 14篇
最新 热点 随机
最新 热点 随机
文章近况 跑步记录:26年3、4月份总结 跑步记录:下半年总结 难绷(5) 难绷(4) 难绷(3)
卡尔曼滤波与组合导航原理(12)地球形状与重力场 机器学习笔记(7)HMM和EM的进一步理解 卡尔曼滤波与组合导航原理(7)UKF、联邦滤波 跑步记录:10月总结(11.02) matlab记录(3)安装字体 强化学习实践(5)使用paddle框架和parl库进行强化学习
Background
https://www.angryovocsr.cn/wp-content/uploads/2021/11/waiting-for-love.mp3

COPYRIGHT © 2021 angryovocsr.cn. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS

辽ICP备2021011214号