python版本代码来源:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 我自己给自己注释的版本: python版本:Q_learning2.zip matlab版本:qlearning.zip 总结: 两者相似点都在于先编写环境。 python编程模板要记住,三个文件分别编写环境、table…
python版本代码来源:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 我自己给自己注释的版本: python版本:Q_learning2.zip matlab版本:qlearning.zip 总结: 两者相似点都在于先编写环境。 python编程模板要记住,三个文件分别编写环境、table…
写在前面:我的本意是用matlab的强化学习模块来进行实践的,因为可以很好地结合simunlink。但是主流都是基于python的强化学习实践,在matlab上的实践教学较少,我只好先学习python平台的实践,加深对理论知识的理解。 一、python的安装及配置 首先,python是一门人与计算机交互的语言,那么就解释器和编译器就是必须的;其次,由于python的特殊性,使用python时会用到很多依赖,例如包、库、一些插件,而不用的项目用到的依赖也会不同,甚…
手写笔记: IMG_2220(20220326-142332).JPG IMG_2221(20220326-142332).JPG IMG_2222(20220326-142332).JPG IMG_2223(20220326-142332).JPG IMG_2224(20220326-142333).JPG IMG_2225(20220326-142333).JPG IMG_2226(20220326-142333).JPG IMG_2227(20220326-142333).JPG IMG_2228(20220…
本讲主要讲了强化学习中model-based的方法,以及结合model-based和model-free的方法dyna。最后一部分强调了planning本身,介绍了simulated-based search(这部分没太听懂)。 主要是一些概念性和思路的讲解,看ppt即可。
手写笔记: IMG_2205(20220323-141531).JPG IMG_2204(20220323-141531).JPG IMG_2206(20220323-141531).JPG IMG_2208(20220323-141531).JPG IMG_2207(20220323-141531).JPG IMG_2209(20220323-141531).JPG IMG_2211(20220323-141532).JPG IMG_2210(20220323-141531).JPG IMG_2212(20220…
手写笔记: IMG_2168(20220321-143342).JPG IMG_2169(20220321-143342).JPG IMG_2170(20220321-143342).JPG IMG_2172(20220321-143343).JPG IMG_2171(20220321-143342).JPG IMG_2173(20220321-143343).JPG IMG_2174(20220321-143343).JPG IMG_2175(20220321-143343).JPG IMG_2176(20220…
手写笔记: IMG_2158(20220318-194004).JPG IMG_2160(20220318-194004).JPG IMG_2159(20220318-194004).JPG IMG_2161(20220318-194004).JPG IMG_2163(20220318-194005).JPG IMG_2162(20220318-194005).JPG IMG_2164(20220318-194005).JPG IMG_2165(20220318-194005).JPG IMG_2166(20220…
手写笔记: IMG_2151(20220317-113645).JPG IMG_2149(20220317-113645).JPG IMG_2150(20220317-113645).JPG IMG_2152(20220317-113646).JPG IMG_2154(20220317-113646).JPG IMG_2153(20220317-113646).JPG 总结:
手写笔记 IMG_2145(20220316-165513).JPG IMG_2144(20220316-165513).JPG IMG_2143(20220316-165513).JPG IMG_2146(20220316-165513).JPG IMG_2147(20220316-165513).JPG 总结: