Open main menu
1Man
全部课程
支持
登录
Home
强化学习入门
3 - 强化学习的近似算法
3-1 值函数近似
3-2 值函数近似算法的局限性
3-3 策略近似算法
3-4 策略梯度算法
3-5 Reinforce算法
3-6 Actor-Critic 算法(一)
3-7 Actor-Critic 算法(二)
3-8 加入世界模型
3-9 加入世界模型的好处
3-10 Monte Carlo Tree Search