眾數 (統計學)
外表

眾數(英文:mode;粵拼:粵化口語音:mou1)係統計學上對平均嘅其中一種計法,屬於集中趨勢一種。眾數嘅計法好簡單,方法係由所有數之中攞出現得最多嗰個,要數據夠多而且有好多重覆數值先至啱用。換句話講,眾數就係最常見嗰個觀測值[1]。
基本計法
[編輯]定義上,眾數係指「最常見嗰個數」。
譬如以下呢組數:
2, 3, 3, 5, 7, 7, 7, 9, 10
喺呢組數據入便,7 出現咗三次,係最常見嗰個值,所以呢組數據嘅 mode 就係 7。而若果某組數據有兩個或者以上嘅數值同樣都係出現次數最多,呢組數據就謂之多眾數(英文:multimodal),例如:
1, 2, 2, 3, 3, 4
眾數有兩個:2 同 3。
優同缺點
[編輯]睇埋:算術平均數
眾數有幾個好處:
- 唔容易受極端值影響:例如收入數據,假如某組人工數值係 20,000、22,000、23,000、25,000、100,000,算術平均數會畀 100,000 呢個極端值拉高,變得唔再貼近大部分人嘅實際收入;但如果大部分人工都係二萬幾,眾數就能夠正確顯示二萬幾先係最常見嘅水平。
- 可以用於非數值數據:例如調查啲人鍾意咩顏色,十個人中有四個人最鍾意藍色,三個最鍾意綠色,三個最鍾意紅色,噉佢哋嘅眾數就係藍色;對於噉嘅分類變數嚟講,平均數同中位數係冇意義嘅,但係眾數仍然用得。
眾數亦有缺點:最基本嗰種眾數,只係計次數多寡,對於連續變數(例如身高、體重呀噉)就唔係咁有用,因為喺呢啲連續數據入面,好少可會有兩個數值完全一樣。
概率分佈
[編輯]
睇埋:函數最高點
假若依家要處理連續概率分佈時,眾數一般會定義為令概率密度函數 f(x) 去到最大值嘅 x [3]。
換句話說,如果隨機變量 X 嘅概率密度函數為 f(x),噉其眾數 m 會滿足以下呢條式:
呢條式用咗實數 同函數最高點 等嘅概念。假如手上個分佈係常態分佈,眾數會等同平均數同中位數,喺正個分佈嘅中心位置。
睇埋
[編輯]引述
[編輯]- ↑ Damodar N. Gujarati. Essentials of Econometrics. McGraw-Hill Irwin. 3rd edition, 2006: p. 110.
- ↑ "AP Statistics Review - Density Curves and the Normal Distributions". 原著喺8 April 2015歸檔. 喺16 March 2015搵到.
- ↑ Zhang, C; Mapes, BE; Soden, BJ (2003). "Bimodality in tropical water vapour". Q. J. R. Meteorol. Soc. 129 (594): 2847–2866. Bibcode:2003QJRMS.129.2847Z. doi:10.1256/qj.02.166. S2CID 17153773.