跳去內容

中位數

出自維基百科,自由嘅百科全書
中位數計算嘅圖解

中位數(參見英文Median,近似粵拼粵化口語音mi1 di4 an4)係統計學集中趨勢嘅其中一種常用指標,用嚟反映一拃數據平均特性。攞住手上啲數值,佢哋嘅中位數計法如下:將所有數按大細排列,攞最中間嗰個,而如果有兩個中間嘅值,就攞兩者嘅平均數

基礎概念

[編輯]
内文:平均值

假想依家有一拃數,啲數嘅數量有限。佢哋嘅中位數,係指將佢哋由細至大排好之後,處於「中間」位置個數就係中位數[1][2]。如果數列入便嘅數值數量係單數,噉就直接揀出中間嗰個。例如,以下七個數,

1, 3, 3, 6, 7, 8, 9

佢哋嘅中位數,就係第四個值,即係 6。而若果數列入便嘅數值數量係雙數,就冇一個單一嘅「中間」值。喺呢種情況下,中位數就通常會定義為最中間嗰兩個數嘅算術平均。例如以下呢組數列,有八個數:

1, 2, 3, 4, 5, 6, 8, 9

中位數就係 4.5,即係 。計中位數前,分析者要排好啲數值先。例如有下面呢堆數:

9, 7, 5, 8, 1

要首先按順序排列:

1, 5, 7, 8, 9

佢哋總共有五個數,中間嗰個係第三個,中位數係 7

廣義化啲講,中位數可以噉樣定義:對於一組由細至大排好嘅數據集 x,包含 n 咁多個數[1]

如果 n 係單數,
如果 n 係雙數,

諸如身高同埋收入等嘅數據,都可以用中位數嚟計:列晒所有人嘅值出嚟,由細到大排好,再攞中間嗰個值,是謂中位數。

概率分佈

[編輯]
同一個偏斜概率分佈,圖中係其平均值(算術平均值)、中位數同眾數[3]

就算係概率分佈,都可以同佢計中位數。是但搵一個實數嘅概率分佈,其累計分佈函數記做 F。個分佈嘅中位數,可以定義為是但一個實數 m,佢係滿足到以下呢條不等式嘅: 同等嘅講法係:設隨機變量 X 按照分佈 F 分佈,咁中位數 m 要滿足: 用日常用語講即係,有一半嘅數值低過 m 同時有一半嘅數值高過 m。若果手上個概率分佈係連續概率分佈,上述嘅不等式可以變成等式,即係個中位數 m 要滿足: 同埋 上述嘅式可以噉講:由個分佈中隨機抽一個值,個值有 50% 機率細過等如 m,有 50% 機率大過等如 m

優點

[編輯]
睇埋:集中趨勢

中位數係一種常用嘅描述統計指標,用嚟反映數據中有咩集中趨勢

啲人成日會攞中位數同算術平均英文mean)比較。同算術平均比,中位數有幾個顯著嘅優點。最大嘅分別,在於中位數對極端值冇咁敏感。舉例講,如果一組數據入面有某個數值零舍大或者零舍細,算術平均通常會俾呢個極端值拉高或者拉低,搞到算術平均反映唔到大部分數據嘅「典型」水平,但中位數只關心中間位置嘅數值,冇咁容易受極端值影響[4]

由於呢個特性,中位數被指係好適合用嚟描述分佈偏斜嘅數據。例如經濟學家想探知粵港地區收入水平統計,少數超高收入人士(想像億萬富翁)會大幅拉高個算術平均值,但中位數就可以更真實噉反映普通人嘅收入狀況。

睇埋

[編輯]

引咗

[編輯]
  1. 1.0 1.1 Weisstein, Eric W., "Statistical Median" - MathWorld.(英文)
  2. Simon, Laura J.; "Descriptive statistics" 互聯網檔案館歸檔,歸檔日期2010-07-30., Statistical Education Resource Kit, Pennsylvania State Department of Statistics
  3. "AP Statistics Review - Density Curves and the Normal Distributions". 原著喺8 April 2015歸檔. 喺16 March 2015搵到.
  4. Robson, Colin (1994). Experiment, Design and Statistics in Psychology. Penguin. pp. 42–45. ISBN 0-14-017648-9.

連結

[編輯]