# RL_Learning

**Repository Path**: xiaokai5785/RL_Learning

## Basic Information

- **Project Name**: RL_Learning
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-10-20
- **Last Updated**: 2025-10-20

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# RL_Learning 🎉️

## 简介 📖

本项目为西湖大学赵世钰老师的强化学习课程代码实践，目前完成了1-9章的大部分代码，包括仿真环境的搭建 值迭代，策略迭代 蒙特卡洛 时序差分 状态值近似 DQN Reinforce 等算法的实现。尽可能的追求复现，但是作者代码水平有限，不免存在许多bug以及效率低下之处，请大家仅作参考。

非常幸运能够发现这一门课，因为这门课我知道了RL。

比较过市面上很多其他的资料，不管是课程还是教材的质量都是顶尖的。

像赵老师一样愿意耗费如此心血，制作如此高质量的视频的老师已经很少了。

谨以此开源仓库向赵老师致敬✋，当然，这个仓库目前还不够。

本人代码以及RL水平有限，仅作参考。

[代码演示视频地址](https://www.bilibili.com/video/BV1HX4y1H7uR)

项目持续更新中 🚶

[赵世钰老师课程地址](https://www.bilibili.com/video/BV1sd4y167NS) 💌