Si vous avez deux facteurs catégorielsf
et g
, puis (1|f/g)
s'étend à (1|f) + (1|f:g)
, c'est- à -dire la variation de l' ordonnée à l'origine (c'est le 1
côté gauche de la barre) entre les niveaux de f
et parmi les niveaux de f:g
(l'interaction entre f
et g
). Ceci est également appelé un effet aléatoire de g
niché dans f
(l'ordre importe ici). C'est la manière traditionnelle de combiner deux facteurs aléatoires dans un modèle ANOVA classique, car dans ce cadre, les effets aléatoires doivent être imbriqués (c'est-à-dire soit f
imbriqués dans, g
soit g
imbriqués avec f
). (Voir http://glmm.wikidot.com/faq pour plus d'informations sur les facteurs imbriqués.) Ce modèle estime deux paramètres, à savoir σ2f et σ2f:g, quel que soit le nombre de niveaux de chaque variable catégorielle. Ce serait un modèle typique pour une conception imbriquée .
En revanche, (f|g)
spécifie que les effets de f
varient selon les niveaux de g
: par exemple, s'il f
s'agit d'une variable catégorielle à deux niveaux avec les niveaux "contrôle" et "traitement", ce modèle spécifie que nous autorisons à la fois l'interception (réponse de contrôle) et l'effet du traitement (différence entre le contrôle et les réponses au traitement) pour varier selon les niveaux de g
. Chaque effet a sa propre variance et lme4
ajuste par défaut des covariances entre chacun des paramètres. Ce modèle estimerait les paramètresσ2g,c, σ2g,t, et σg,c⋅t, où le dernier fait référence à la covariance entre les effets de contrôle et de traitement. Sif a n niveaux, ce modèle estime n(n+1)/2paramètres; il est plus approprié pour une conception de blocs randomisés où chaque traitement est répété dans chaque bloc.
Si elle f
a plusieurs niveaux, cette dernière (f|g)
spécification de modèle peut impliquer des modèles avec de nombreux paramètres; un débat est en cours (voir par exemple ce document ArXiv ) sur la meilleure façon de gérer cette situation.
Si à la place nous considérons (x|g)
où x
est une variable d'entrée continue (numérique), alors le terme spécifie un modèle à pentes aléatoires; l'ordonnée à l'origine (implicitement) et la pente par rapport aux x
deux varient selon les niveaux de g
(un terme de covariance est également ajusté).
Dans ce cas, cela (g|x)
n'aurait aucun sens - le terme sur le côté droit de la barre est une variable de regroupement et est toujours interprété comme catégorique. Le seul cas où cela pourrait avoir un sens est dans une conception où x
était continu, mais plusieurs observations ont été prises à chaque niveau, et où vous vouliez traiter x
comme une variable catégorielle à des fins de modélisation.