Hadoop細分的話包含兩部分,一部分是HDFS,這個是分佈式文件系統,包含NameNode和DataNode,用於存儲pb級數據,特點就是大,可以部署到上前台上萬台機器上,用於存儲。 還有一個部分是MapReduce,這個是一個計算框架,用於離線分析數據,還有一個Yarn,這個是Rarn可以説是一個資源管理類和任務調度器,用於管理和調度程序,包括MapReduce但又不限於MapReduce,也可以運行spark等。
下面就是生態圈了,hadoop生態圈還包含spark,flume,hbase,kakfa等等