Angry Csr

  • Home
  • About me
  • Blog
  • GuildWar2
Welcome to my HomePage!!
  1. 首页
  2. 学习记录
  3. 正文

强化学习实践(3)sarsa及sarsa(lambda)

2022年4月13日 3173点热度 0人点赞 0条评论

matlab示例:

sarsa:Sarsa.zip

sarsa(lambda):接下来试试按照matlab的思路,编写一下rlSARSAAlambdagent和新的table以及eligibility trace

我把sarsa单独放在了一个m文件中,训练过程和示例不一样,没找到问题出在了哪里。

python示例:

sarsa:Sarsa.zip

sarsa(lambda):Sarsa(lambda).7z

总结:matlab全部模块化,只有sarsa函数没有sarsa(lambda)函数,硬写m文件也就失去了使用matlab强化学习工具箱的优势,不如python了。

          强化学习代码现在看来,算法是最简单的,env的编写和table的编写在是最困难的;看看后面在连续空间用神经网络后,不使用table了,代码怎样编写把

标签: 暂无
最后更新:2022年4月13日

愤怒的叉烧肉丶

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

取消回复
最近评论
分类
  • Blog / 36篇
  • GuildWar2 / 1篇
  • 卡尔曼滤波与组合导航原理 / 13篇
  • 学习记录 / 72篇
  • 工程流体力学基础 / 3篇
  • 强化学习 / 23篇
  • 机器学习 / 10篇
  • 深度学习与神经网络 / 7篇
  • 鲁棒控制 / 14篇
最新 热点 随机
最新 热点 随机
文章近况 跑步记录:26年3、4月份总结 跑步记录:下半年总结 难绷(5) 难绷(4) 难绷(3)
文章近况 深度学习笔记(2)复习线性模型 深度学习笔记(7)网络正则化 机器学习笔记(5)Lagrange multiplier, SVM,Kernel Methods ​流体力学(完结) 卡尔曼滤波与组合导航原理(10)高斯积分非线性滤波
Background
https://www.angryovocsr.cn/wp-content/uploads/2021/11/waiting-for-love.mp3

COPYRIGHT © 2021 angryovocsr.cn. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS

辽ICP备2021011214号