Angry Csr

  • Home
  • About me
  • Blog
  • GuildWar2
Welcome to my HomePage!!
学习记录

强化学习笔记(11)探索与利用

手写笔记: IMG_2220(20220326-142332).JPG IMG_2221(20220326-142332).JPG IMG_2222(20220326-142332).JPG IMG_2223(20220326-142332).JPG IMG_2224(20220326-142333).JPG IMG_2225(20220326-142333).JPG IMG_2226(20220326-142333).JPG IMG_2227(20220326-142333).JPG IMG_2228(20220…

2022年3月26日 0条评论 2859点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(10)集成学习和规划

       本讲主要讲了强化学习中model-based的方法,以及结合model-based和model-free的方法dyna。最后一部分强调了planning本身,介绍了simulated-based search(这部分没太听懂)。       主要是一些概念性和思路的讲解,看ppt即可。

2022年3月24日 0条评论 2812点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(9)前六节梳理

前六节梳理及总结.pdf

2022年3月23日 0条评论 2798点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

​强化学习笔记(8)策略梯度

手写笔记: IMG_2205(20220323-141531).JPG IMG_2204(20220323-141531).JPG IMG_2206(20220323-141531).JPG IMG_2208(20220323-141531).JPG IMG_2207(20220323-141531).JPG IMG_2209(20220323-141531).JPG IMG_2211(20220323-141532).JPG IMG_2210(20220323-141531).JPG IMG_2212(20220…

2022年3月23日 0条评论 2735点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(7)价值函数逼近

手写笔记: IMG_2168(20220321-143342).JPG IMG_2169(20220321-143342).JPG IMG_2170(20220321-143342).JPG IMG_2172(20220321-143343).JPG IMG_2171(20220321-143342).JPG IMG_2173(20220321-143343).JPG IMG_2174(20220321-143343).JPG IMG_2175(20220321-143343).JPG IMG_2176(20220…

2022年3月21日 0条评论 2717点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(6)无模型控制

手写笔记: IMG_2158(20220318-194004).JPG IMG_2160(20220318-194004).JPG IMG_2159(20220318-194004).JPG IMG_2161(20220318-194004).JPG IMG_2163(20220318-194005).JPG IMG_2162(20220318-194005).JPG IMG_2164(20220318-194005).JPG IMG_2165(20220318-194005).JPG IMG_2166(20220…

2022年3月18日 0条评论 2849点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(5)免模型预测

手写笔记: IMG_2151(20220317-113645).JPG IMG_2149(20220317-113645).JPG IMG_2150(20220317-113645).JPG IMG_2152(20220317-113646).JPG IMG_2154(20220317-113646).JPG IMG_2153(20220317-113646).JPG 总结:

2022年3月17日 0条评论 2693点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(4)动态规划DP

手写笔记 IMG_2145(20220316-165513).JPG IMG_2144(20220316-165513).JPG IMG_2143(20220316-165513).JPG IMG_2146(20220316-165513).JPG IMG_2147(20220316-165513).JPG 总结:

2022年3月16日 0条评论 2754点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(3)马尔科夫过程

手写笔记: IMG_2136(20220315-184006).JPG IMG_2134(20220315-184006).JPG IMG_2135(20220315-184006).JPG IMG_2137(20220315-184006).JPG IMG_2138(20220315-184006).JPG IMG_2139(20220315-184006).JPG IMG_2140(20220315-184006).JPG IMG_2141(20220315-184006).JPG 思路梳理:

2022年3月15日 0条评论 2794点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
学习记录

强化学习笔记(2)简介

课程地址: https://www.davidsilver.uk/ 手写笔记 IMG_2129(20220315-184005).JPG IMG_2131(20220315-184005).JPG IMG_2130(20220315-184005).JPG IMG_2133(20220315-184005).JPG IMG_2132(20220315-184005).JPG

2022年3月15日 0条评论 2771点热度 0人点赞 愤怒的叉烧肉丶 阅读全文
12

愤怒的叉烧肉丶

这个人很懒,什么都没留下

链接
  • b站主页
  • Csr工具导航
文章分类
  • Blog / 36篇
  • GuildWar2 / 1篇
  • 卡尔曼滤波与组合导航原理 / 13篇
  • 学习记录 / 72篇
  • 工程流体力学基础 / 3篇
  • 强化学习 / 23篇
  • 机器学习 / 10篇
  • 深度学习与神经网络 / 7篇
  • 鲁棒控制 / 14篇
最新 热点 随机
最新 热点 随机
文章近况 跑步记录:26年3、4月份总结 跑步记录:下半年总结 难绷(5) 难绷(4) 难绷(3)
跑步记录:26年3、4月份总结文章近况
2022年度总结 跑步记录:下半年总结 ​matlab记录(2)simulink小操作 强化学习笔记(补1)TD(lambda)和sarsa(lambda)的进一步理解 路径平滑(轨迹规划)的一些思路 鲁棒控制理论(8)不确定性和鲁棒性
归档



COPYRIGHT © 2021 angryovocsr.cn. ALL RIGHTS RESERVED.

THEME KRATOS MADE BY VTROIS

辽ICP备2021011214号