matlab示例:
sarsa:
Sarsa.zip
sarsa(lambda):接下来试试按照matlab的思路,编写一下rlSARSAAlambdagent和新的table以及eligibility trace
我把sarsa单独放在了一个m文件中,训练过程和示例不一样,没找到问题出在了哪里。
python示例:
sarsa:
Sarsa.zip
sarsa(lambda):
Sarsa(lambda).7z
总结:matlab全部模块化,只有sarsa函数没有sarsa(lambda)函数,硬写m文件也就失去了使用matlab强化学习工具箱的优势,不如python了。
强化学习代码现在看来,算法是最简单的,env的编写和table的编写在是最困难的;看看后面在连续空间用神经网络后,不使用table了,代码怎样编写把
文章评论