大數據分析,第一要會hive,是一種類sql的語法,只要會mysql的語法,基本沒問題,只有略微不同
第二,要懂一些數據挖掘算法,比如常見的邏輯迴歸,隨機森林,支持向量機等
第三,懂得一些統計學的計算邏輯,比如協方差怎麼算,意義是什麼,皮爾遜相關係數的意義和條件等等。