跳去內容

混合模型

出自維基百科,自由嘅百科全書
  提示:呢篇文講嘅唔係混合物模型
想像中有群組結構嘅數據:假想依家做醫學研究,由一間醫院度搵咗兩位病人返嚟研究,對兩位病人各進行咗三次量度

混合模型統計模型嘅一類,泛指個模型嘅參數有啲係固定效應,有啲係隨機效應。用日常用語講,呢種模型唔單止會睇變數之間嘅關係,仲會考慮埋數據中嘅「分層」結構,譬如有多位受試者,對每位受試者都重複做多次量度噉;喺呢啲情況底下,用傳統嘅迴歸分析就未必夠準-傳統嘅迴歸分析假設咗觀察到嘅數值彼此間係獨立嘅,嚟自同一位受試者嘅數值彼此一定唔獨立[1]。而混合模型就係一種為咗處理呢啲「有群組結構」嘅數據而設嘅分析方法[2]

基礎概念

[編輯]

混合模型最大特色係同時包含[2]

呢種模型做到喺普通嘅線性模型中,加入咗一層「變異性」,嚟處理重複測量或者群組之間嘅差異。固定效應係研究者真正有興趣去估計嘅變數間關係,就好似一般迴歸模型入便嘅自變數。呢啲變數喺研究入面係固定嘅,研究者希望知道佢哋具體對應變數有冇影響,以及影響幾大。相比之下,隨機效應就嚟自更大嘅群體。

應用例子

[編輯]

想像依家做臨床試驗,測試某隻新藥 X,睇吓 X 係咪有助降低血壓。研究方法如下:

  • 有 100 個高血壓嘅病人,分咗喺 10 間唔同醫院接受治療。
  • 每個病人喺治療前後都會量血壓,連續幾日追蹤。
  • 有啲病人食新藥,有啲食安慰劑
  • 研究問題係:「X 對降低血壓係咪真係有用?」

是次研究嘅數據明顯有群組結構,個體病人分做 10 個群組(組係醫院),此外,由於是次研究對每位病人都做咗幾次量度,所以啲個別量度又分咗做 100 組(組係病人)。唔同醫院可能會有唔同嘅環境同醫生,呢啲因素都可能會影響病人嘅病情同血壓,而且嚟自同一個人嘅量度一定會互相影響。因此,用一般嘅迴歸模型(當正 100 位病人喺血壓上彼此獨立)好可能會扭曲研究嘅結果。因此,研究人員就好可能要採用混合模型:

  • 固定效應:食藥 vs 對照(治療組別),仲有係性別年齡等嘅人口學變數
  • 隨機效應:病人(考慮到同一病人重複測量)、醫院(考慮唔同醫院之間嘅差異)

噉嘅話最後個統計模型就會更加準確。

睇埋

[編輯]

引述

[編輯]
  1. Dawid, A. P. (1979). "Conditional Independence in Statistical Theory". Journal of the Royal Statistical Society, Series B. 41 (1): 1–31.
  2. 2.0 2.1 Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963-974.