Open main menu
1Man
全部课程
支持
登录
Home
实用数据挖掘与人工智能特训班
47 - 马尔可夫决策过程
47-1 马尔可夫决策过程:Markov状态转移矩阵
47-2 Markov Rewards Process
47-3 状态价值state value
47-4 Bellman方程(一)
47-5 Bellman方程(二)
47-6 Bellman方程(三)
47-7 Bellman方程(四)
47-8 状态价值函数 v.s 动作价值函数(一)
47-9 状态价值函数 v.s 动作价值函数(二)
47-10 最优总价值与最优动作价值(一)
47-11 最优总价值与最优动作价值(二)
47-12 Flappy bird的简单解决方法(一)
47-13 Flappy bird的简单解决方法(二)