Skip to main content Link Menu Expand (external link) Document Search Copy Copied

4. 马尔可夫决策过程 (MDPs)

作者: Nikhil Sharma

编辑: Saathvik Selvan 和 Wesley Zheng

致谢: 部分章节改编自教材 Artificial Intelligence: A Modern Approach

最后更新: 2024年10月

* * * * [4.1 马尔可夫决策过程](/cs188/zh-cn/mdp/markov-decision-processes.html) * [4.2 解决马尔可夫决策过程](/cs188/zh-cn/mdp/solve.html) * [4.3 值迭代](/cs188/zh-cn/mdp/value-iteration.html) * [4.4 策略迭代](/cs188/zh-cn/mdp/policies-iteration.html) * [4.5 总结](/cs188/zh-cn/mdp/summary.html)