雙方都是高手且理性,每一步都全域性最優。即使輸,也要走全域性最優,使得輸得最少。
動態規劃——每個局面,唯一確定一個狀態,局面可以是不同初始條件的開局,也可以是同一初始下不同的殘局令勝負結果是一個整數分值,雙方得分高者獲勝,站在先手角度,每一步都希望得到最大分站在後手角度,每一步都希望對方得到最小分顯然,你不能只考慮一步或者兩步。
諾貝爾經濟學獎得主羅伯特奧曼認為,博弈論應該是“互動的決策論”,因為人們之間的決策與行為,會形成互為影響的關係,一個主體在決策時必須考慮到對方的反應。