Mapreduce是一個計算框架,既然是做計算的框架,那麼表現形式就是有個輸入(input),mapreduce操作這個輸入(input),透過本身定義好的計算模型,得到一個輸出(output),這個輸出就是我們所需要的結果。
在執行一個mapreduce計算任務時候,任務過程被分爲兩個階段:map階段和reduce階段,每個階段都是用鍵值對(key/value)作爲輸入(input)和輸出(output)。而程序員要做的就是定義好這兩個階段的函數:map函數和reduce函數。