Quand les modèles mixtes à corrélation zéro sont-ils théoriquement valables?


25

La citation ci-dessous, tirée de chefs de file dans le domaine de la modélisation à effets mixtes, affirme que les changements de coordonnées dans les modèles avec une corrélation nulle entre les effets aléatoires (modèles «ZCP») modifient les prévisions des modèles. Mais, quelqu'un peut-il développer ou justifier davantage ses affirmations?

Les déclarations en question sont tirées de l'article de Bates et al de 2015 sur lme4, Ajustement des modèles linéaires à effets mixtes à l'aide de lme4 , page 7, deuxième paragraphe ( lien de téléchargement ).

Voici une paraphrase de ce qu'ils ont écrit:

Bien que les modèles à paramètres de corrélation zéro soient utilisés pour réduire la complexité des modèles à pente aléatoire, ils présentent un inconvénient. Les modèles dans lesquels les pentes et les intersections peuvent avoir une corrélation non nulle sont invariants aux déplacements additifs d'un prédicteur continu.

Cette invariance tombe en panne lorsque la corrélation est contrainte à zéro; tout changement dans le prédicteur entraînera nécessairement un changement dans la corrélation estimée, ainsi que dans la probabilité et les prévisions du modèle. 1 Par exemple, nous pouvons éliminer la corrélation dans fm1 simplement en décalant Days [le prédicteur accompagnant la ] d'un montant égal au rapport des écarts-types estimés parmi les sujets multipliés par la corrélation estimée, c'est-à-dire 2 ,slope

ρslope:intercept×σslopeσintercept

L'utilisation de tels modèles devrait idéalement être limitée aux cas où le prédicteur est mesuré sur une échelle de rapport (c'est-à-dire que le point zéro sur l'échelle est significatif, et pas seulement un emplacement défini par commodité ou convention).

Des questions:

Numéroté en accord avec les exposants ci-dessus ...

  1. Je peux voir que tout changement dans le système de coordonnées par lequel le prédicteur est mesuré entraînera un changement dans la corrélation estimée, conduisant ainsi à une corrélation non nulle. Cela corrobore l'affirmation selon laquelle les modèles de paramètres de corrélation nulle ne sont pas invariants lors des changements dans les systèmes de coordonnées prédictives, et donc que tout modèle avec des corrélations à effets aléatoires non nulles peut être transformé en un modèle avec des corrélations nulles par un décalage approprié des coordonnées. Je pense qu'il prend également en charge le troisième paragraphe de la paraphrase ci-dessus: les modèles ZCP (et les modèles à interception nulle - voir ci-dessous; mais veuillez me vérifier à ce sujet ) ne sont valables que pour les modèles utilisant certains systèmes de coordonnées spéciaux. Mais pourquoi un changement de coordonnées devrait-il modifier les prévisions pour de tels modèles?

    Par exemple, un changement de coordonnées changera également le terme d'interception à effet fixe pour les moyennes de groupe (voir ci-dessous), mais uniquement d'une quantité appropriée au changement d'origine pour le système de coordonnées du prédicteur. Un tel changement n'a pas d'impact sur les prédictions du modèle, tant que le nouveau système de coordonnées est utilisé pour le prédicteur décalé.

    Pour élaborer, si la pente à effet fixe associée au prédicteur décalé est positive et que l'origine du système de coordonnées du prédicteur est décalée dans le sens négatif, alors l'interception à effet fixe diminuera et toute interception à effet aléatoire associée changera également. en conséquence, reflétant la nouvelle définition de «l'origine» (et donc de l'interception) dans le système de coordonnées décalé. Soit dit en passant, je pense que ce raisonnement implique également qu'un modèle d'interception nulle n'est pas non plus invariant sous de tels changements.

  1. Je pense que j'ai une façon raisonnable de résoudre ce problème, mais j'ai obtenu une réponse légèrement différente de celle de Bates et al. Suis-je en train de me tromper quelque part?

    xδ>0x=x+δρ

    δ=ρslope:intercept×σinterceptσslope

    Cela diffère du résultat de Bates et al .


slopeinterceptintki1kslopexx×slopeiy^obsiρxslope

ρslope:int=Ei[(slopeislopei¯)(intiinti¯)]Ei[(slopeislopei¯)2]Ei[(intiinti¯)2]

int=δ×slope+intδ>0xρδβ0=δ×βx+β0βxx.


1
y^

Je suis un peu déçu que cela n'ait pas attiré plus d'attention, @clarpaul. Vous pourriez simplement mettre votre propre réponse. Si personne d'autre ne répond, je vous donnerai juste la prime.
gung - Rétablir Monica

Merci @gung, ma réponse serait étroitement alignée avec mes "modifications" ci-dessus. La prime serait bien, mais je n'ai peut-être pas le temps avant qu'elle expire. J'encourage quiconque à prendre mes "modifications" et à les transformer en réponse, s'il est d'accord avec le raisonnement de base, et est prêt à prendre le temps de les peaufiner un peu.
clarpaul

Réponses:


4
  1. 0changer les prédictions du modèle. Et (si vous vous attendez à ce que les modèles LME soient invariants par rapport à des décalages de coordonnées sensibles), seuls les modèles dans lesquels de tels décalages de coordonnées n'ont pas de sens sont théoriquement sensibles en tant que modèles ZCP (c'est-à-dire les modèles «spéciaux» mentionnés dans le troisième paragraphe de la paraphrase). de Bates et al ci-dessus). [Remarque: J'embellirai cette réponse à l'avenir pour inclure les formules que j'ai dérivées pour la corrélation qui se développe lors du déplacement des coordonnées d'un modèle initialement ZCP, et pour la preuve que les modèles LME avec des corrélations non contraintes sont invariants par rapport à la traduction.]
  2. δxσinterceptρσslope1/xslopeδ d'avoir les bonnes dimensions.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.