中位數

中位數(參見英文:Median,近似粵拼:粵化口語音:mi1 di4 an4)係統計學上集中趨勢嘅其中一種常用指標,用嚟反映一拃數據嘅平均特性。攞住手上啲數值,佢哋嘅中位數計法如下:將所有數按大細排列,攞最中間嗰個,而如果有兩個中間嘅值,就攞兩者嘅平均數。
基礎概念
[編輯]假想依家有一拃數,啲數嘅數量有限。佢哋嘅中位數,係指將佢哋由細至大排好之後,處於「中間」位置個數就係中位數[1][2]。如果數列入便嘅數值數量係單數,噉就直接揀出中間嗰個。例如,以下七個數,
佢哋嘅中位數,就係第四個值,即係 6。而若果數列入便嘅數值數量係雙數,就冇一個單一嘅「中間」值。喺呢種情況下,中位數就通常會定義為最中間嗰兩個數嘅算術平均。例如以下呢組數列,有八個數:
中位數就係 4.5,即係 。計中位數前,分析者要排好啲數值先。例如有下面呢堆數:
要首先按順序排列:
佢哋總共有五個數,中間嗰個係第三個,中位數係 7。
廣義化啲講,中位數可以噉樣定義:對於一組由細至大排好嘅數據集 x,包含 n 咁多個數[1],
- 如果 n 係單數,
- 如果 n 係雙數,
諸如身高同埋收入等嘅數據,都可以用中位數嚟計:列晒所有人嘅值出嚟,由細到大排好,再攞中間嗰個值,是謂中位數。
概率分佈
[編輯]
就算係概率分佈,都可以同佢計中位數。是但搵一個實數嘅概率分佈,其累計分佈函數記做 F。個分佈嘅中位數,可以定義為是但一個實數 m,佢係滿足到以下呢條不等式嘅: 同等嘅講法係:設隨機變量 X 按照分佈 F 分佈,咁中位數 m 要滿足: 用日常用語講即係,有一半嘅數值低過 m 同時有一半嘅數值高過 m。若果手上個概率分佈係連續概率分佈,上述嘅不等式可以變成等式,即係個中位數 m 要滿足: 同埋 上述嘅式可以噉講:由個分佈中隨機抽一個值,個值有 50% 機率細過等如 m,有 50% 機率大過等如 m。
優點
[編輯]中位數係一種常用嘅描述統計指標,用嚟反映數據中有咩集中趨勢。
啲人成日會攞中位數同算術平均(英文:mean)比較。同算術平均比,中位數有幾個顯著嘅優點。最大嘅分別,在於中位數對極端值冇咁敏感。舉例講,如果一組數據入面有某個數值零舍大或者零舍細,算術平均通常會俾呢個極端值拉高或者拉低,搞到算術平均反映唔到大部分數據嘅「典型」水平,但中位數只關心中間位置嘅數值,冇咁容易受極端值影響[4]。
由於呢個特性,中位數被指係好適合用嚟描述分佈偏斜嘅數據。例如經濟學家想探知粵港地區嘅收入水平統計,少數超高收入人士(想像億萬富翁)會大幅拉高個算術平均值,但中位數就可以更真實噉反映普通人嘅收入狀況。
睇埋
[編輯]引咗
[編輯]- ↑ 1.0 1.1 Weisstein, Eric W., "Statistical Median" - MathWorld.(英文)
- ↑ Simon, Laura J.; "Descriptive statistics" 互聯網檔案館嘅歸檔,歸檔日期2010-07-30., Statistical Education Resource Kit, Pennsylvania State Department of Statistics
- ↑ "AP Statistics Review - Density Curves and the Normal Distributions". 原著喺8 April 2015歸檔. 喺16 March 2015搵到.
- ↑ Robson, Colin (1994). Experiment, Design and Statistics in Psychology. Penguin. pp. 42–45. ISBN 0-14-017648-9.