馬爾可夫決策過程是研究隨機環境下多階段決策過程優化問題的理論工具,在過去的幾十年中,隨着生態科學、經濟理論、通訊工程以及眾多學科中需要考慮不確定因素和序列決策問題的大量新模型的湧現,進一步刺激了馬爾可夫決策過程在理論上和應用領域中長足發展。