J'ai parcouru de nombreux sites d'aide et je ne sais toujours pas comment spécifier des termes imbriqués plus compliqués dans un modèle mixte. Je suis également confus en ce qui concerne l'utilisation de :
et /
et |
en spécifiant les interactions et l'imbrication avec des facteurs aléatoires à l'aide lmer()
du lme4
package dans R
.
Aux fins de cette question, supposons que j'ai représenté avec précision mes données avec ce modèle statistique standard: est fixe, et sont aléatoires. est (implicitement) imbriqué dans .
station
tow
day
Tow
station
En d'autres termes, j'espère que mon modèle comprend Station (i, fixe), Tow (j, aléatoire, implicitement imbriqué dans Station), Day (k, random), et l'interaction entre Tow et Day, et l'interaction entre Day et Station. J'ai consulté un statisticien pour créer mon modèle et je le crois pour le moment représentatif de mes données, mais j'ajouterai également une description de mes données pour ceux qui sont intéressés au bas de mon message afin de ne pas encombrer.
Jusqu'à présent, ce que j'ai pu reconstituer est le suivant lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Est-ce que cela représente avec précision mon modèle statistique? Des suggestions pour améliorer mon code s'il ne se lit pas correctement?
J'ai mis en gras les termes spécifiques que j'ai du mal à spécifier dans ma formule lmer
#1. remorquage imbriqué dans la station lorsque le remorquage est aléatoire et que la station est fixe
Je suis confus, cependant à propos de la distinction entre les termes imbriqués et d'interaction qui sont aléatoires en utilisant :
et /
. Dans mon exemple ci-dessus, j'ai (1|station:tow)
dans lequel j'espère que les lectures sont imbriquées dans la station. J'ai lu des commentaires contradictoires sur divers sites, que j'utilise ou non ici :
ou /
dans le (1|...)
format aléatoire de lmer
.
# 2. L'interaction entre la station et le jour lorsque la station est fixe et le jour est aléatoire,
je l'ai alors, (1|station:day)
mais cette fois j'espère qu'elle lit l'interaction entre la station et le jour. Il semble que je pourrais utiliser station * day pour tenir compte des effets individuels de la station et du jour ainsi que de leur interaction (plutôt que d'inclure chacun des trois termes séparément comme je le fais ci-dessus), mais je ne vois pas comment le spécifier quand l'un est fixe et l'autre est aléatoire. Feriez- station*(1|day)
vous cela?
# 3. L'interaction entre le remorquage et le jour (tous deux aléatoires) lorsque le remorquage est imbriqué dans la station (fixe)
Enfin, j'ai (1|tow:day)
ce que j'espère lire l'interaction de tow
et day
, mais je me demande si je dois spécifier à nouveau que le remorquage est imbriqué (implicitement) en station?
Je suis nouveau dans la modélisation statistique R
et lmer
et et j'apprécie grandement la difficulté d'explications approfondies dans toutes les réponses à mes questions si possible.
Plus de détails sur mes données: je demande si les concentrations de plancton varient sur un front physique dans l'océan littoral. J'ai trois stations, à terre, à l'intérieur et au large de ce front. La station est donc fixe. À chaque station, je prends trois traits de plancton répliqués (à partir desquels je trie, compte et obtient une concentration en termes de nombre de punaises par mètre cube d'eau). Le remorquage est aléatoire: en trois traits, j'espère tenir compte de la variabilité générale du plancton à cette station particulière. Le remorquage est intrinsèquement imbriqué dans la station, car chaque remorquage n'a pas d'ID unique (123, 123, 123 est l'ID des remorques à chaque station). Je l'ai ensuite fait plusieurs jours indépendants avec un nouveau front qui s'était formé. Je pense que je peux considérer Day comme un facteur de blocage? Le jour est aléatoire car répéter ceci sur plusieurs fronts indépendants indépendants tente de saisir la variabilité d'un jour à l'autre et d'être représentatif de tous les jours où ce front est présent. Je veux connaître les termes d'interaction pour voir si la variabilité des remorques varie d'un jour à l'autre et si les stations fournissent toujours des données similaires ou cela dépend-il du jour?
Encore une fois, merci pour votre temps et votre aide, je l'apprécie!
R
syntaxe, l'OMI, il est suffisamment statistique (pour comprendre comment le modèle spécifié se rapporte à l'imbrication et aux interactions, etc.) pour être sur le sujet pour CV.
lmer()
syntaxe, vous avez spécifié un modèle où il y a un effet fixe de station
et quatre interceptions aléatoires, partagées par des individus avec la même (1) combinaison de station
et tow
, (2) valeur de Day
, (3) combinaison de station
et day
et ( 4) combinaison de tow
et day
, respectivement. C'est bien ce que vous vouliez? Je ne suis pas sûr car, comme indiqué par @BabekP, la façon dont vous avez écrit la formulation de votre modèle n'est pas claire. Vous avez écrit des noms de variables, pas des paramètres. Normalement, dans un modèle comme celui-ci, les combinaisons de variables sont capturées par les indices.