Angry Csr

  • Home
  • About me
  • Blog
  • GuildWar2
Welcome to my HomePage!!
  1. 首页
  2. 学习记录
  3. 正文

强化学习笔记(6)无模型控制

2022年3月18日 2852点热度 0人点赞 0条评论

手写笔记:

IMG_2158(20220318-194004).JPG

IMG_2160(20220318-194004).JPG

IMG_2159(20220318-194004).JPG

IMG_2161(20220318-194004).JPG

IMG_2163(20220318-194005).JPG

IMG_2162(20220318-194005).JPG

IMG_2164(20220318-194005).JPG

IMG_2165(20220318-194005).JPG

IMG_2166(20220318-194005).JPG

小结:至此,RL的基本理论已经全部结束,David Sliver的课程结构安排我认为十分合理,听完之后,整个强化学习的基本框架已经掌握了,概念基本清晰,剩下            就是不断地加深理解和实践了。

标签: policy-based learning Q-learning
最后更新:2022年4月26日

愤怒的叉烧肉丶

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

取消回复
最近评论
分类
  • Blog / 36篇
  • GuildWar2 / 1篇
  • 卡尔曼滤波与组合导航原理 / 13篇
  • 学习记录 / 72篇
  • 工程流体力学基础 / 3篇
  • 强化学习 / 23篇
  • 机器学习 / 10篇
  • 深度学习与神经网络 / 7篇
  • 鲁棒控制 / 14篇
最新 热点 随机
最新 热点 随机
文章近况 跑步记录:26年3、4月份总结 跑步记录:下半年总结 难绷(5) 难绷(4) 难绷(3)
matlab记录(3)安装字体 卡尔曼滤波与组合导航原理(13)捷联惯导数值更新算法 工程流体力学基础(2)流体动力学基础 一个很痛的领悟 matlab记录(4)一些小操作 鲁棒控制理论(1)自控基础
Background
https://www.angryovocsr.cn/wp-content/uploads/2021/11/waiting-for-love.mp3

COPYRIGHT © 2021 angryovocsr.cn. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS

辽ICP备2021011214号