在統計學中,交叉表是矩陣格式的一種表格,顯示變量的(多變量)頻率分佈。交叉表被廣泛用於調查研究,商業智能,工程和科學研究。它們提供了兩個變量之間的相互關係的基本畫面,可以幫助他們發現它們之間的相互作用。卡爾·皮爾遜(Karl Pearson)首先在“關於應變的理論及其關聯理論與正常相關性”中使用了交叉表。
多元統計學的一個關鍵問題是找到高維應變表中包含的變量的(直接)依賴結構。如果某些有條件的獨立性被揭示,那麼甚至可以以更智能的方式來完成數據的存儲。為了做到這一點,可以使用信息理論概念,它只能從概率分佈中獲得信息,這可以通過相對頻率從交叉表中容易地表示。
Tags: