# RL_Learning **Repository Path**: xiaokai5785/RL_Learning ## Basic Information - **Project Name**: RL_Learning - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-20 - **Last Updated**: 2025-10-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # RL_Learning 🎉️ ## 简介 📖 本项目为西湖大学赵世钰老师的强化学习课程代码实践,目前完成了1-9章的大部分代码,包括仿真环境的搭建 值迭代,策略迭代 蒙特卡洛 时序差分 状态值近似 DQN Reinforce 等算法的实现。尽可能的追求复现,但是作者代码水平有限,不免存在许多bug以及效率低下之处,请大家仅作参考。 非常幸运能够发现这一门课,因为这门课我知道了RL。 比较过市面上很多其他的资料,不管是课程还是教材的质量都是顶尖的。 像赵老师一样愿意耗费如此心血,制作如此高质量的视频的老师已经很少了。 谨以此开源仓库向赵老师致敬✋,当然,这个仓库目前还不够。 本人代码以及RL水平有限,仅作参考。 [代码演示视频地址](https://www.bilibili.com/video/BV1HX4y1H7uR) 项目持续更新中 🚶 [赵世钰老师课程地址](https://www.bilibili.com/video/BV1sd4y167NS) 💌