本讲主要讲了强化学习中model-based的方法,以及结合model-based和model-free的方法dyna。最后一部分强调了planning本身,介绍了simulated-based search(这部分没太听懂)。
主要是一些概念性和思路的讲解,看ppt即可。
本讲主要讲了强化学习中model-based的方法,以及结合model-based和model-free的方法dyna。最后一部分强调了planning本身,介绍了simulated-based search(这部分没太听懂)。
主要是一些概念性和思路的讲解,看ppt即可。
愤怒的叉烧肉丶
这个人很懒,什么都没留下
文章评论