用stata算集中指數採用Stata系統自帶數據庫。
一、集中趨勢的統計描述
以變量price為例進行説明。
均數:採用mean price計算得6165.257。
算術均數、幾何均數和調和均數可以採用means、ameans、gmeans、hmeans計算。
眾數:沒有對應的命令可以直接計算眾數,但是可以通過幾種策略進行變通計算。如通過egen x=mode(price) disp x drop x,不過本例中price中沒有相同的數值,所以無法計算眾數另外也可通過preserve contract price, freq(x) sum x list price if x==r(max) restore 來顯示。
中位數:centile price或tabstat price, s(med),當然tabstat還可以計算均數、樣本量、標準差,標準誤、方差、極差、四分位間距、變異係數、峯度係數、偏度係數等等很多指標。
不過採用Stata(summarize ,tabstat等命令)計算的峯度係數與Excel、SPSS和SAS計算的結果有所不同,原因是採用的公式不同,大家根據實際情況來選擇。
二、離散趨勢指標
極差(全距):tabstat price, s(r)
標準差:tabstat price, s(sd)
方差:tabstat price, s(v)
四分位間距:tabstat price, s(iqr)
變異係數:tabstat price, s(cv)
採用summarize , detail命令可以計算均數、標準差、峯度係數、偏度係數、多個百分位數。不加detial可以得到最大值、最小值。