Écriture de l'équation mathématique d'un modèle multi-niveaux à effets mixtes

La question du CV

J'essaie de donner (a) une représentation mathématique détaillée et concise d'un modèle à effets mixtes. J'utilise le lme4package dans R. Quelle est la représentation mathématique correcte pour mon modèle?

Les données, la question scientifique et le code R

Mon ensemble de données comprend des espèces dans différentes régions. Je teste si la prévalence d'une espèce change dans le temps menant à une extinction (les extinctions ne sont pas nécessairement permanentes; elle peut recoloniser), ou après une colonisation.

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

La prévalence est la proportion de strates occupées par une espèce dans une région-année
Le temps est une variable continue qui indique le temps d'extinction ou de colonisation; c'est toujours positif
Le type est une variable catégorielle à deux niveaux. Ces deux niveaux sont «-» et «+». Lorsque le type est -, c'est une colonisation (niveau par défaut). Lorsque le type est +, c'est une extinction.
Reg est une variable catégorielle à neuf niveaux, indiquant la région
Spp est une variable catégorielle; le nombre de niveaux varie selon les régions et varie entre 48 niveaux et 144 niveaux.

En mots: la variable de réponse est la prévalence (proportion de strates occupées). Les effets fixes comprenaient 1) et l'interception, 2) le temps écoulé depuis l'événement et 3) l'interaction entre le temps passé et le type d'événement (colonisation ou extinction). Chacun de ces 3 effets fixes a varié de façon aléatoire entre les régions. Au sein d'une région, chacun des effets variait de manière aléatoire entre les espèces.

J'essaie de comprendre comment écrire l'équation mathématique pour le modèle. Je pense que je comprends ce qui se passe dans le code R (bien que, je suis sûr que j'ai des lacunes dans les connaissances, et j'espère que l'écriture de l'expression mathématique formelle améliorera ma compréhension).

J'ai beaucoup cherché sur le Web et sur ces forums. J'ai trouvé des tonnes d'informations utiles, bien sûr (et je vais peut-être créer un lien vers certaines d'entre elles dans une modification de cette question). Cependant, je ne pouvais pas vraiment trouver que "Rosetta Stone" du code R traduit en mathématiques (je suis plus à l'aise avec le code) qui m'aiderait vraiment à confirmer que ces équations sont correctes. En fait, je sais qu'il y a déjà des lacunes, mais nous y reviendrons.

Ma tentative

La forme de base d'un modèle à effets mixtes, en notation matricielle est (à ma connaissance):

Y = X β + Z γ + ϵ

$Y = X \beta + Z \gamma + \epsilon$

X = [\begin{matrix} 1 & Δ t & Δ t_{+} \\ ⋮ & ⋮ & ⋮ \\ 1 & Δ t_{n} & Δ t_{+, n} \end{matrix}]

$X = \begin{bmatrix} 1 & \Delta t & \Delta t_{+} \\ \vdots & \vdots & \vdots \\ 1 & \Delta t_n & \Delta t_{+,n} \end{bmatrix}$

β^{^{'}} = [\begin{matrix} β_{0} & β_{1} & β_{2} \end{matrix}]

$\beta^{'} = \begin{bmatrix} \beta_0 & \beta_1 & \beta_2 \end{bmatrix}$

Z = [\begin{matrix} 1 I (r_{1}) & Δ t I (r_{1}) & Δ t_{+} I (r_{1}) & \dots & 1 I (r_{9}) & Δ t I (r_{9}) & Δ t_{+} I (r_{9}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 1 I (r_{1, n}) & Δ t_{n} I (r_{1, n}) & Δ t_{+, n} I (r_{1, n}) & \dots & 1 I (r_{9, n}) & Δ t I (r_{9, n}) & Δ t_{+, n} I (r_{9, n}) \end{matrix}]

$Z = \begin{bmatrix} 1 I(r_1) & \Delta t I(r_1) & \Delta t_{+} I(r_1) & \dots & 1 I(r_9) & \Delta t I(r_9) & \Delta t_{+} I(r_9) \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 1 I(r_{1,n}) & \Delta t_n I(r_{1,n}) & \Delta t_{+,n} I(r_{1,n}) & \dots & 1 I(r_{9,n}) & \Delta t I(r_{9,n}) & \Delta t_{+,n} I(r_{9,n}) \\ \end{bmatrix}$

γ^{^{'}} = [\begin{matrix} γ_{0, 1} & γ_{1, 1} & γ_{2, 1} & \dots & γ_{0, 9} & γ_{1, 9} & γ_{2, 9} \end{matrix}]

$\gamma^{'} = \begin{bmatrix} \gamma_{0,1} & \gamma_{1,1} &\gamma_{2,1} & \dots & \gamma_{0,9} & \gamma_{1,9} &\gamma_{2,9} \end{bmatrix}$

ϵ \sim N (0, Σ)

$\epsilon \sim \mathcal{N}(0,\Sigma)$

est la matrice de conception des effets fixes, est le temps après la colonisation () et est le temps après l'extinction () $X$ $\Delta t$ time $\Delta t_{+}$ time:type
est la matrice de conception pour les effets aléatoires (niveau 1?), I () est la fonction d'indicateur donnant 1 si l'échantillon appartient à la région désignée et 0 sinon, r est indexé pour indiquer l'une des neuf régions. $Z$
et contiennent des paramètres $\beta$ $\gamma$
est une erreur; Je ne sais pas trop comment expliquer , bien que je réalise qu'une de ces matrices de variance / covariance exprimera les covariances entre les pentes et les intersections, par exemple $\epsilon$ $\Sigma$

En supposant que les choses jusqu'à présent sont ~ correctes, cela signifie que je suis bon au niveau supérieur. Cependant, expliquer la variation spécifique à l'espèce des paramètres, qui est imbriquée dans chaque région, m'a encore plus embrouillé.

Mais j'ai essayé quelque chose qui avait peut-être du sens ...

$\gamma$ $\gamma$

- $U_{p,r}$ $r$ $p$ $b_{p,r}$ $S$ $\eta_{p,r}$

$\gamma_{p,r}$

γ_{0, r} = U_{0, r} b_{0, r} + η_{0, r}

$\gamma_{0,r} = U_{0,r} b_{0,r} + \eta_{0,r}$

γ_{0, r} = [\begin{matrix} 1 I (s_{1}) \dots 1 I (s_{S}) \end{matrix}] + [\begin{matrix} b_{0, 1} \\ ⋮ \\ b_{0, S} \end{matrix}] + η_{0, r}

$\gamma_{0,r} = \begin{bmatrix} 1 I(s_1) \dots 1 I(s_S) \end{bmatrix} + \begin{bmatrix} b_{0,1}\\ \vdots \\ b_{0,S} \end{bmatrix} + \eta_{0,r}$

γ_{1, r} = U_{1, r} b_{1, r} + η_{1, r}

$\gamma_{1,r} = U_{1,r} b_{1,r} + \eta_{1,r}$

γ_{1, r} = [\begin{matrix} Δ t I (s_{1}) \dots Δ t I (s_{S}) \end{matrix}] + [\begin{matrix} b_{1, 1} \\ ⋮ \\ b_{1, S} \end{matrix}] + η_{1, r}

$\gamma_{1,r} = \begin{bmatrix} \Delta t I(s_1) \dots \Delta t I(s_S) \end{bmatrix} + \begin{bmatrix} b_{1,1}\\ \vdots \\ b_{1,S} \end{bmatrix} + \eta_{1,r}$

γ_{2, r} = U_{2, r} b_{2, r} + η_{2, r}

$\gamma_{2,r} = U_{2,r} b_{2,r} + \eta_{2,r}$

γ_{2, r} = [\begin{matrix} Δ t_{+} I (s_{1}) \dots Δ t_{+} I (s_{S}) \end{matrix}] + [\begin{matrix} b_{2, 1} \\ ⋮ \\ b_{2, S} \end{matrix}] + η_{2, r}

$\gamma_{2,r} = \begin{bmatrix} \Delta t_+ I(s_1) \dots \Delta t_+ I(s_S) \end{bmatrix} + \begin{bmatrix} b_{2,1}\\ \vdots \\ b_{2,S} \end{bmatrix} + \eta_{2,r}$

$\eta \sim \mathcal{N}(0,\Sigma_{\eta})$ $\epsilon$ $\Sigma$ $G$

Edit: autres questions / réponses qui ont été quelque peu utiles

Ce Q / A était agréable, mais n'a pas écrit les choses sous la forme de matrice complète

r mixed-model multilevel-analysis lme4-nlme

— rbatt
source

Je doute que cet article ait la «réponse» à votre question, mais il m'a bien servi d'amorce aux équations du modèle HMM. Oubliez qu'il est enraciné dans SAS, c'est juste un excellent aperçu de cette classe de modèles. Judith Singer, Using SAS Proc Mixed to Fit Multinevel Models, Hierarchical Models, and Individual Growth Models, JEBS , Winter 1998, vol. 24, n ° 4, pp. 323-355.

— Mike Hunter

Avez-vous lu la section 2.3 ici ?

— Robert Long

Je les ai lus et des ressources comme celle-là m'ont mené jusqu'ici. Il se peut que je doive continuer d'essayer, mais je n'ai trouvé aucun exemple suffisamment compliqué pour me donner suffisamment confiance en mon approche actuelle.

— rbatt

Pour autant que je sache, l '"imbrication" n'est qu'une interaction dans les modèles lmer. Cette notion est renforcée par l'utilisation de la même syntaxe. Je pense donc que reg: spp peut être géré par une seule variable catégorielle, et juste un autre ensemble de blocs en Z.

— deasmhumnha

Je suppose également que lmer évitera une colinéarité parfaite et n'inclura que les interactions non redondantes dans la variable supplémentaire.

— deasmhumnha

Si j'ai bien compris le code, pourquoi ne pas simplement écrire quelque chose comme

y_{i} = (α + ν_{j [i]}^{(α)} + η_{k [i]}^{(α)}) + (β + ν_{j [i]}^{(β)} + η_{k [i]}^{(β)}) T_{i} + (δ + ν_{j [i]}^{(δ)} + η_{k [i]}^{(δ)}) (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \Big(\alpha + \nu_{j[i]}^{(\alpha)} + \eta_{k[i]}^{(\alpha)}\Big) + \Big(\beta + \nu_{j[i]}^{(\beta)} + \eta_{k[i]}^{(\beta)}\Big)T_{i} + \Big(\delta + \nu_{j[i]}^{(\delta)} + \eta_{k[i]}^{(\delta)}\Big)(T_{i} * Z_{i}) + \epsilon_i$

\begin{aligned} [ν_{j}^{(α)}, ν_{j}^{(β)}, ν_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{ν}) \\ [η_{j}^{(α)}, η_{j}^{(β)}, η_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{η}) \\ ϵ_{i} & \sim Normal (0, σ_{ϵ}) \end{aligned}

$\begin{aligned} \Big[\nu_{j}^{(\alpha)}, \nu_j^{(\beta)}, \nu_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\nu) \\ \Big[\eta_{j}^{(\alpha)}, \eta_j^{(\beta)}, \eta_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\eta)\\ \epsilon_i & \sim \text{Normal}(0, \sigma_\epsilon) \end{aligned}$

y_{i} = α_{j [i], k [i]} + β_{j [i], k [i]} T_{i} + δ_{j [i], k [i]} (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \alpha_{j[i],k[i]} + \beta_{j[i],k[i]}T_{i} + \delta_{j[i],k[i]}(T_i * Z_i) + \epsilon_i$

\begin{aligned} α_{j [i], k [i]} & = α + ν_{j}^{(α)} + η_{k}^{(α)} \\ β_{j [i], k [i]} & = β + ν_{j}^{(β)} + η_{k}^{(β)} \\ δ_{j [i], k [i]} & = δ + ν_{j}^{(δ)} + η_{k}^{(δ)} \end{aligned}

$\begin{aligned} \alpha_{j[i],k[i]} &= \alpha + \nu_{j}^{(\alpha)} + \eta_{k}^{(\alpha)} \\ \beta_{j[i],k[i]}&=\beta + \nu_{j}^{(\beta)} + \eta_{k}^{(\beta)}\\ \delta_{j[i],k[i]}&=\delta + \nu_{j}^{(\delta)} + \eta_{k}^{(\delta)}\\ \end{aligned}$

— baruuum
source