Modelització jeràrquica bayesiana
La modelització jeràrquica bayesiana és un model estadístic escrit en múltiples nivells (forma jeràrquica) que estima els paràmetres de la distribució posterior utilitzant el mètode bayesià. Els submodels es combinen per formar el model jeràrquic, i el teorema de Bayes s'utilitza per integrar-los amb les dades observades i tenir en compte tota la incertesa present. El resultat d'aquesta integració és que permet calcular la distribució posterior de la distribució a priori, proporcionant una estimació de probabilitat actualitzada.[1]
L'estadística freqüentista pot donar lloc a conclusions aparentment incompatibles amb les que ofereix l'estadística bayesiana a causa del tractament bayesià dels paràmetres com a variables aleatòries i el seu ús d'informació subjectiva per establir suposicions sobre aquests paràmetres.[2] Com que els enfocaments responen a preguntes diferents, els resultats formals no són tècnicament contradictoris, però els dos enfocaments discrepen sobre quina resposta és rellevant per a aplicacions particulars. Els bayesians argumenten que la informació rellevant sobre la presa de decisions i l'actualització de creences no es pot ignorar i que el modelatge jeràrquic té el potencial d'anul·lar els mètodes clàssics en aplicacions on els enquestats proporcionen múltiples dades observacionals. A més, el model ha demostrat ser robust, amb una distribució posterior menys sensible a les distribucions a priori jeràrquiques més flexibles.[3]
El modelatge jeràrquic, com el seu nom indica, conserva l'estructura de dades imbricada i s'utilitza quan la informació està disponible a diversos nivells diferents d'unitats d'observació. Per exemple, en la modelització epidemiològica per descriure trajectòries d'infecció per a múltiples països, les unitats d'observació són països, i cada país té el seu propi perfil basat en el temps de casos infectats diaris.[4] En l'anàlisi de la corba de declivi per descriure la corba de declivi de la producció de petroli o gas per a múltiples pous, les unitats d'observació són pous de petroli o gas en una regió del jaciment, i cada pou té el seu propi perfil basat en el temps de les taxes de producció de petroli o gas (normalment, barrils per mes).[5] El modelatge jeràrquic s'utilitza per idear estratègies basades en la computació per a problemes multiparamètrics.[6]
Filosofia
[modifica]
Els mètodes i models estadístics solen incloure múltiples paràmetres que es poden considerar relacionats o connectats de manera que el problema implica una dependència del model de probabilitat conjunta per a aquests paràmetres. Els graus individuals de creença, expressats en forma de probabilitats, comporten incertesa.[7] Enmig d'això hi ha el canvi dels graus de creença al llarg del temps. Com van afirmar el professor José M. Bernardo i el professor Adrian F. Smith, "l'actualitat del procés d'aprenentatge consisteix en l'evolució de les creences individuals i subjectives sobre la realitat". Aquestes probabilitats subjectives estan més directament implicades en la ment que en les probabilitats físiques.[7] Per tant, és amb aquesta necessitat d'actualitzar les creences que els bayesians han formulat un model estadístic alternatiu que té en compte l'ocurrència prèvia d'un esdeveniment concret.
Teorema de Bayes
[modifica]La suposada ocurrència d'un esdeveniment del món real normalment modificarà les preferències entre certes opcions. Això es fa modificant els graus de creença que un individu atribueix als esdeveniments que defineixen les opcions.
Suposem que en un estudi sobre l'efectivitat dels tractaments cardíacs, els pacients de l'hospital j tenen probabilitat de supervivència , la probabilitat de supervivència s'actualitzarà amb l'ocurrència de y, l'esdeveniment en què es crea un sèrum controvertit que, com creuen alguns, augmenta la supervivència en pacients cardíacs.
Per tal de fer afirmacions de probabilitat actualitzades sobre , donada l'ocurrència de l'esdeveniment y, hem de començar amb un model que proporcioni una distribució de probabilitat conjunta per a i y. Això es pot escriure com a producte de les dues distribucions que sovint es coneixen com a distribució a priori i la distribució de la mostra respectivament:
Utilitzant la propietat bàsica de la probabilitat condicional, la distribució posterior donarà:
Aquesta equació, que mostra la relació entre la probabilitat condicional i els esdeveniments individuals, es coneix com a teorema de Bayes. Aquesta simple expressió encapsula el nucli tècnic de la inferència bayesiana, que pretén desconstruir la probabilitat, , en relació amb els subconjunts resolubles de les seves proves de suport.
Intercanviable
[modifica]El punt de partida habitual d'una anàlisi estadística és la suposició que els valors n són intercanviables. Si no hi ha informació disponible –a part de les dades y– per distingir cap dels 's de qualsevol altre, i no es pot fer cap ordenació o agrupació dels paràmetres, cal assumir la simetria dels paràmetres de distribució anteriors. Aquesta simetria es representa probabilísticament mitjançant l'intercanviabilitat. Generalment, és útil i apropiat modelar les dades d'una distribució intercanviable com a distribuïdes independentment i idènticament, donat un vector de paràmetres desconegut. , amb distribució .
Models jeràrquics
[modifica]Components
[modifica]El modelatge jeràrquic bayesià utilitza dos conceptes importants per derivar la distribució posterior, és a dir:
- Hiperparàmetres: paràmetres de la distribució a priori
- Hiperpriors: distribucions d'hiperparàmetres
Marc
[modifica]Sigui una observació i un paràmetre que regeix el procés de generació de dades per a . Suposem a més que els paràmetres es generen de manera intercanviable a partir d'una població comuna, amb una distribució governada per un hiperparàmetre .

El model jeràrquic bayesià conté les següents etapes:
La probabilitat, tal com es veu a la fase I, és , amb com la seva distribució prèvia. Tingueu en compte que la probabilitat depèn de només a través de .
La distribució prèvia de l'etapa I es pot desglossar en:
[de la definició de probabilitat condicional]
Amb com el seu hiperparàmetre amb distribució hiperprior, .
Així, la distribució posterior és proporcional a:
- [utilitzant el teorema de Bayes]
Model bayesià no lineal d'efectes mixtos
[modifica]Una versió de tres etapes del model jeràrquic bayesià es podria utilitzar per calcular la probabilitat a 1) nivell individual, 2) a nivell de població i 3) a priori, que és una distribució de probabilitat assumida que té lloc abans que s'adquireixin inicialment les proves:
Etapa 1: Model a nivell individual
Etapa 2: Model de població
Etapa 3: Prèvia
Aquí, denota la resposta contínua de la -èsim subjecte en el moment , i és el covariable -èsima de la -èsim subjecte. Els paràmetres implicats en el model s'escriuen en lletres gregues. La variable és una funció coneguda parametritzada per vector dimensional .
Normalment, és una funció «no lineal» i descriu la trajectòria temporal dels individus. En el model, i descriuen la variabilitat intraindividual i la variabilitat interindividual, respectivament. Si no es considera la relació a priori, la relació es redueix a un model freqüentista no lineal d'efectes mixtos.
Referències
[modifica]- ↑ Albert, Jim; Hu, Jingchen. Bayesian Hierarchical Modeling (en anglès). Chapman and Hall/CRC, 2019-12-06, p. 365–407. ISBN 978-1-351-03014-4.
- ↑ Gelman, Andrew. Bayesian Data Analysis (en anglès). second. Boca Raton, Florida: CRC Press, 2004, p. 4–5. ISBN 1-58488-388-X.
- ↑ «Hierarchical models» (en anglès). [Consulta: 23 juny 2025].
- ↑ Lee, Se Yoon; Lei, Bowen; Mallick, Bani PLOS ONE, 15, 7, 2020, pàg. e0236860. arXiv: 2005.00662. Bibcode: 2020PLoSO..1536860L. DOI: 10.1371/journal.pone.0236860. PMC: 7390340. PMID: 32726361 [Consulta: free].
- ↑ Lee, Se Yoon; Mallick, Bani Sankhya B, 84, 2021, pàg. 1–43. DOI: 10.1007/s13571-020-00245-8 [Consulta: free].
- ↑ Ross, Kevin. Chapter 19 Introduction to Hierarchical Models | An Introduction to Bayesian Reasoning and Methods (en anglès).
- ↑ 7,0 7,1 Good, I.J. Trabajos de Estadistica y de Investigacion Operativa, 31, 1980, pàg. 489–519. DOI: 10.1007/BF02888365.
- ↑ Lee, Se Yoon Mathematics, 10, 6, 2022, pàg. 898. arXiv: 2201.12430. DOI: 10.3390/math10060898 [Consulta: free].