强化学习笔记（6）无模型控制

手写笔记：

小结：至此，RL的基本理论已经全部结束，David Sliver的课程结构安排我认为十分合理，听完之后，整个强化学习的基本框架已经掌握了，概念基本清晰，剩下就是不断地加深理解和实践了。