4. 马尔可夫决策过程 (MDPs)

作者: Nikhil Sharma

编辑: Saathvik Selvan 和 Wesley Zheng

致谢: 部分章节改编自教材 Artificial Intelligence: A Modern Approach。

最后更新: 2024年10月

4.1 马尔可夫决策过程
4.2 解决马尔可夫决策过程
4.3 值迭代
4.4 策略迭代
4.5 总结

* * * * [4.1 马尔可夫决策过程](/cs188/zh-cn/mdp/markov-decision-processes.html) * [4.2 解决马尔可夫决策过程](/cs188/zh-cn/mdp/solve.html) * [4.3 值迭代](/cs188/zh-cn/mdp/value-iteration.html) * [4.4 策略迭代](/cs188/zh-cn/mdp/policies-iteration.html) * [4.5 总结](/cs188/zh-cn/mdp/summary.html)