Supposons que j'ai une variable de réponse qui a été mesurée à partir du e frère de la e famille. De plus, certaines données comportementales ont été collectées en même temps auprès de chaque sujet. J'essaie d'analyser la situation avec le modèle linéaire à effets mixtes suivant:
où et sont respectivement l'ordonnée à l'origine et la pente fixes, est la pente aléatoire et est le résiduel.
Les hypothèses pour les effets aléatoires et résiduels sont (en supposant qu'il n'y a que deux frères et sœurs dans chaque famille)
où est un paramètre de variance inconnu et la structure de variance-covariance R est une matrice de forme symétrique 2 x 2
qui modélise la corrélation entre les deux frères et sœurs.
Est-ce un modèle approprié pour une telle étude sur les frères et sœurs?
Les données sont un peu compliquées. Parmi les 50 familles, près de 90% d'entre elles sont des jumeaux dizygotes (DZ). Pour les autres familles,
- deux n'ont qu'un frère ou une sœur;
- deux ont une paire DZ plus un frère; et
- deux ont une paire DZ plus deux frères et sœurs supplémentaires.
Je crois que
lme
le package Rnlme
peut facilement gérer (1) avec une situation manquante ou déséquilibrée. Mon problème est de savoir comment gérer (2) et (3)? Une possibilité à laquelle je peux penser est de diviser chacune de ces quatre familles en (2) et (3) en deux afin que chaque sous-famille ait un ou deux frères et sœurs afin que le modèle ci-dessus puisse être appliqué. Est-ce bien? Une autre option serait de simplement jeter les données d'un ou deux frères et sœurs supplémentaires dans (2) et (3), ce qui semble être un gaspillage. De meilleures approches?Il semble que cela
lme
permette de fixer les valeurs dans la matrice de variance-covariance résiduelle R , par exemple r 2 = 0,5. Est-il judicieux d'imposer la structure de corrélation, ou devrais-je simplement l'estimer sur la base des données?
lme