Quel est l'avantage de traiter un facteur comme aléatoire dans un modèle mixte?

24

J'ai un problème à accepter les avantages d'étiqueter un facteur de modèle comme aléatoire pour plusieurs raisons. Il me semble que dans presque tous les cas, la solution optimale consiste à traiter tous les facteurs comme fixes.

Premièrement, la distinction entre fixe et aléatoire est assez arbitraire. L'explication standard est que, si l'on s'intéresse aux unités expérimentales particulières en soi, alors on devrait utiliser des effets fixes et, si on s'intéresse à la population représentée par les unités expérimentales, on devrait utiliser des effets aléatoires. Cela n'aide pas beaucoup car cela implique que l'on peut alterner entre vues fixes et vues aléatoires même si les données et la conception expérimentale restent les mêmes. De plus, cette définition favorise l'illusion que, si un facteur est étiqueté comme aléatoire, l'inférence tirée du modèle est en quelque sorte plus applicable à la population que dans le cas où le facteur est étiqueté comme fixe. Enfin, Gelman montre que la distinction fixe-aléatoire prête à confusion même au niveau de la définition, car il existe quatre autres définitions de ce que sont les effets fixes et aléatoires.

Deuxièmement, l'estimation des modèles mixtes est assez compliquée. Par opposition à un modèle "purement fixe", il existe plus de plusieurs façons d'obtenir les valeurs de p. Le professeur Bates qui a implémenté l'estimation REML dans le paquet lme4 dans R est même allé jusqu'à refuser de déclarer les valeurs de p .

Troisièmement, le nombre de paramètres implicites introduits par un facteur aléatoire pose un problème flou. L'exemple suivant est mon adaptation de celle de Burnham & Anderson, Model Selection and Multi-Model Inference: A Practical Information-Theoretic Approach . Du point de vue du compromis biais-variance, le rôle des effets aléatoires peut être illustré comme suit. Considérons une ANOVA unidirectionnelle avec traitements et effets de facteur principal, dont sont estimables. Le terme d'erreur a la distribution . Si le nombre d'observations est fixe, le compromis biais-variance se détériorera à mesure que augmentera. Supposons que nous disons que le $K$ $K$ $K - 1$ $\mathcal N(0, \sigma^2)$ $K$ $K$ les effets principaux sont tirés de la distribution . Le modèle correspondant aura une complexité qui se situe quelque part entre la version fixe (surajustée) et le modèle sous-équipé qui contient uniquement l'interception. Le nombre de paramètres effectifs dans le modèle fixe est $\mathcal N(0, \sigma_K)$

1 i n t e r c e p t + (K - 1) m a i n e f f e c t s + 1 σ = K + 1.

$1 \:\:\mathrm{intercept} + (K - 1) \:\:\mathrm{main\: effects} + 1 \:\:\sigma = K + 1.$

Le nombre de paramètres effectifs dans le modèle aléatoire est d'au moins trois: . De plus, le modèle aléatoire a un certain nombre de paramètres «cachés» impliqués par la restriction distributionnelle (normale dans ce cas) imposée aux effets principaux. $\mathrm{intercept}, \sigma, \sigma_K$

En particulier, s'il existe un facteur à deux niveaux, cela n'a pas de sens de l'appeler aléatoire, même si nous savons avec certitude que ses niveaux ont été échantillonnés au hasard dans une certaine population. En effet, la version à effet fixe a trois paramètres et la version à effet aléatoire a plus de trois paramètres. Dans ce cas, le modèle aléatoire s'avère plus complexe que la version fixe. Apparemment, un passage de la version fixe à la version aléatoire est plus mis à la terre pour un plus grand $K$ . Cependant, le nombre de paramètres «cachés» dans le modèle aléatoire est inconnu, il est donc impossible de comparer les versions fixes et aléatoires sur la base des critères d'information tels que l'AIC. Par conséquent, bien que cet exemple éclaire la contribution des effets aléatoires (la possibilité d'un meilleur compromis biais-variance), il montre également qu'il est difficile de dire quand il est justifiable de renommer le facteur de fixe à aléatoire.

Aucun des problèmes ci-dessus n'est présent dans un modèle «purement fixe». Par conséquent, je suis prêt à demander:

Quelqu'un peut-il donner un exemple lorsque quelque chose de très grave s'est produit lorsqu'un facteur aléatoire a été utilisé comme s'il était fixe? Je pense qu'il devrait y avoir des études de simulation qui abordent explicitement la question.
Existe-t-il une méthode quantitative éprouvée pour décider quand il est judicieux de passer d'une étiquette fixe à une étiquette aléatoire?

— James
source

Question bien écrite et j'ai appris quelques choses en la lisant. Je me demande si l'analyse des effets aléatoires est condamnée à long terme, peut-être à battre par des techniques de lissage plus simples. Si j'essaie de répondre à la première question, j'irai dans une situation où la variabilité est élevée, de nombreux sujets et de petits échantillons au sein du sujet. Ensuite, les estimations fixes au sein du sujet seront partout.

— Ben Ogorek

20

1. Un exemple célèbre de psychologie et de linguistique est décrit par Herb Clark (1973; d'après Coleman, 1964): «L'erreur du langage comme effet fixe: une critique des statistiques linguistiques dans la recherche psychologique».

Clark est un psycholinguiste qui discute d'expériences psychologiques dans lesquelles un échantillon de sujets de recherche réagit à un ensemble de matériaux de stimulation, généralement divers mots tirés de certains corpus. Il souligne que la procédure statistique standard utilisée dans ces cas, basée sur des mesures répétées ANOVA, et désignée par Clark comme , traite les participants comme un facteur aléatoire mais (peut-être implicitement) traite les matériaux de stimulation (ou "langage") comme fixe. Cela conduit à des problèmes d'interprétation des résultats des tests d'hypothèse sur le facteur de condition expérimental: naturellement, nous voulons supposer qu'un résultat positif nous dit quelque chose à la fois sur la population à partir de laquelle nous avons prélevé notre échantillon de participants ainsi que sur la population théorique à partir de laquelle nous avons puisé. les supports linguistiques. Mais $F_1$ , en traitant les participants comme aléatoires et les stimuli comme fixes, ne nous dit que l'effet du facteur de condition sur d'autres participants similaires répondantexactement aux mêmes stimuli. La réalisation de l'analyse lorsque les participants et les stimuli sont mieux perçus comme aléatoires peut conduire à des taux d'erreur de type 1 qui dépassent considérablement leniveau nominal- généralement 0,05 - dont l'étendue dépend de facteurs tels que le nombre et la variabilité des stimuli et la conception de l'expérience. Dans ces cas, l'analyse la plus appropriée, au moins dans le cadre classique de l'ANOVA, est d'utiliser ce qu'on appelle desstatistiquesquasi- basées sur des ratios decombinaisons linéaires de $F_1$ $F_1$ $\alpha$ $F$ carrés moyens.

L'article de Clark a fait sensation dans la psycholinguistique à l'époque, mais n'a pas réussi à percer la littérature psychologique plus large. (Et même dans le domaine de la psycholinguistique, les conseils de Clark se sont quelque peu déformés au fil des ans, comme le démontrent Raaijmakers, Schrijnemakers et Gremmen, 1999.) dans les modèles à effets mixtes, dont le modèle mixte classique ANOVA peut être considéré comme un cas particulier. Certains de ces articles récents incluent Baayen, Davidson et Bates (2008), Murayama, Sakaki, Yan et Smith (2014) et ( ahem ) Judd, Westfall et Kenny (2012). Je suis sûr qu'il y en a que j'oublie.

2. Pas exactement. Il existe des méthodes pour déterminer si un facteur est mieux inclus en tant qu'effet aléatoire ou non dans le modèle (voir par exemple, Pinheiro et Bates, 2000, p. 83-87; cependant, voir Barr, Levy, Scheepers et Tily, 2013). Et bien sûr, il existe des techniques classiques de comparaison de modèles pour déterminer si un facteur est mieux inclus en tant qu'effet fixe ou pas du tout (par exemple, lestests ). Mais je pense qu'il est généralement préférable de déterminer si un facteur est considéré comme fixe ou aléatoire comme une question conceptuelle, à laquelle il faut répondre en considérant la conception de l'étude et la nature des conclusions à en tirer. $F$

Un de mes instructeurs diplômés en statistique, Gary McClelland, aimait à dire que la question fondamentale de l'inférence statistique est peut-être: "Par rapport à quoi?" Après Gary, je pense que nous pouvons formuler la question conceptuelle que j'ai mentionnée ci-dessus comme suit: à quelle classe de référence de résultats expérimentaux hypothétiques je veux comparer mes résultats réels observés? En restant dans le contexte psycholinguistique et en considérant un plan expérimental dans lequel nous avons un échantillon de sujets répondant à un échantillon de mots qui sont classés dans l'une des deux conditions (le plan particulier discuté longuement par Clark, 1973), je me concentrerai sur deux possibilités:

L'ensemble des expériences dans lesquelles, pour chaque expérience, nous tirons un nouvel échantillon de sujets, un nouvel échantillon de mots et un nouvel échantillon d'erreurs du modèle génératif. Dans ce modèle, les sujets et les mots sont tous deux des effets aléatoires.
L'ensemble d'expériences dans lequel, pour chaque expérience, nous tirons un nouvel échantillon de sujets et un nouvel échantillon d'erreurs, mais nous utilisons toujours le même ensemble de mots . Dans ce modèle, les sujets sont des effets aléatoires mais les mots sont des effets fixes.

Pour rendre cela totalement concret, voici quelques tracés de (ci-dessus) 4 ensembles de résultats hypothétiques de 4 expériences simulées sous le modèle 1; (ci-dessous) 4 ensembles de résultats hypothétiques de 4 expériences simulées sous le modèle 2. Chaque expérience affiche les résultats de deux façons: (panneaux de gauche) regroupés par sujets, avec les moyennes sujet par condition tracées et liées ensemble pour chaque sujet; (panneaux de droite) regroupés par mots, avec des diagrammes en boîte résumant la distribution des réponses pour chaque mot. Toutes les expériences impliquent 10 sujets répondant à 10 mots, et dans toutes les expériences, «l'hypothèse nulle» d'aucune différence de condition est vraie dans la population concernée.

Sujets et mots aléatoires: 4 expériences simulées

both_random

Notez ici que dans chaque expérience, les profils de réponse pour les sujets et les mots sont totalement différents. Pour les sujets, nous obtenons parfois des réponses globales faibles, parfois des réponses élevées, parfois des sujets qui ont tendance à montrer de grandes différences de condition, et parfois des sujets qui ont tendance à montrer une petite différence de condition. De même, pour les mots, nous obtenons parfois des mots qui ont tendance à susciter des réponses faibles, et parfois des mots qui ont tendance à susciter des réponses élevées.

Sujets aléatoires, Mots fixes: 4 expériences simulées

subs_random

Notez ici qu'à travers les 4 expériences simulées, les sujets semblent différents à chaque fois, mais les profils de réponse pour les mots sont essentiellement les mêmes, ce qui est cohérent avec l'hypothèse que nous réutilisons le même ensemble de mots pour chaque expérience sous ce modèle.

Notre choix de savoir si nous pensons que le modèle 1 (sujets et mots tous les deux aléatoires) ou le modèle 2 (sujets aléatoires, mots fixes) fournit la classe de référence appropriée pour les résultats expérimentaux que nous avons réellement observés peut faire une grande différence dans notre évaluation du fait que la manipulation de la condition "travaillé." Nous nous attendons à plus de variations aléatoires dans les données du modèle 1 que du modèle 2, car il y a plus de «pièces mobiles». Donc, si les conclusions que nous souhaitons tirer sont plus cohérentes avec les hypothèses du modèle 1, où la variabilité des chances est relativement plus élevée, mais nous analysons nos données sous les hypothèses du modèle 2, où la variabilité des chances est relativement plus faible, alors notre erreur de type 1 Le taux de test de la différence de condition va être gonflé dans une certaine mesure (peut-être assez importante). Pour plus d'informations, consultez les références ci-dessous.

Les références

Baayen, RH, Davidson, DJ et Bates, DM (2008). Modélisation à effets mixtes avec effets aléatoires croisés pour les sujets et les objets. Journal of memory and language, 59 (4), 390-412. PDF

Barr, DJ, Levy, R., Scheepers, C., et Tily, HJ (2013). Structure des effets aléatoires pour les tests d'hypothèse de confirmation: Gardez-la maximale. Journal of Memory and Language, 68 (3), 255-278. PDF

Clark, HH (1973). L'erreur du langage comme effet fixe: une critique des statistiques linguistiques dans la recherche psychologique. Journal of verbal learning and verbal behavior, 12 (4), 335-359. PDF

Coleman, EB (1964). Généralisation à une population linguistique. Rapports psychologiques, 14 (1), 219-226.

Judd, CM, Westfall, J., et Kenny, DA (2012). Traiter les stimuli comme un facteur aléatoire en psychologie sociale: une solution nouvelle et complète à un problème omniprésent mais largement ignoré. Journal de personnalité et psychologie sociale, 103 (1), 54. PDF

Murayama, K., Sakaki, M., Yan, VX et Smith, GM (2014). L'inflation d'erreur de type I dans l'analyse traditionnelle par participant à la précision de la métamémoire: une perspective généralisée du modèle à effets mixtes. Journal of Experimental Psychology: Learning, Memory, and Cognition. PDF

Pinheiro, JC et Bates, DM (2000). Modèles à effets mixtes en S et S-PLUS. Springer.

Raaijmakers, JG, Schrijnemakers, J., et Gremmen, F. (1999). Comment faire face à «l'erreur du langage en tant qu'effet fixe»: idées fausses courantes et solutions alternatives. Journal of Memory and Language, 41 (3), 416-426. PDF

— Jake Westfall
source

1

+1 C'est une excellente réponse, et votre article de 2012 est une très bonne lecture.

— Amoeba dit Reinstate Monica

puisque la question d'origine a déjà été liée à une excellente discussion qui aborde ce sujet - à quoi faites-vous allusion exactement?

— James

1

The Gelman link

— Jake Westfall

@James, j'ai continué et ajouté quelques éléments plus conceptuels, y compris des photos. Laissez-moi savoir ce que vous pensez.

— Jake Westfall

Merci pour les photos. Selon votre dernier paragraphe, plus les effets du modèle sont étiquetés comme aléatoires, plus la valeur de p pour les effets fixes restants est élevée. Cependant, pour un modèle additif, il ressemble à la méthode par défaut "confinement" utilisée dans PROC MIXED, alors la valeur de p pour un effet fixe sera la même. Un exemple particulier se trouve dans cette question: stats.stackexchange.com/q/112640/54099 Comment pouvez-vous expliquer cela?

— James

1

Supposons que j'ai un processus de fabrication qui implique de fabriquer du matériel sur plusieurs machines différentes. Ce sont les seules machines que j'ai, donc "machine" est un effet fixe. Mais je fabrique beaucoup de matériel sur chaque machine et je suis intéressé à prédire des choses sur les futurs lots. Je vais faire du "numéro de lot" un facteur aléatoire car je suis intéressé par les résultats que j'obtiendrai pour les futurs lots.

— Emil Friedman
source

1

Cher Emil: Je crains que vous n'ayez pas compris les questions que j'ai posées. Votre exemple illustre la définition la plus courante de «fixe vs aléatoire» que j'ai moi-même fournie dans ma question. Quoi qu'il en soit, en utilisant votre exemple, pouvez-vous me dire pourquoi c'est une mauvaise idée de tirer des conclusions sur la réponse future d'un modèle où le numéro de lot est un facteur fixe?

— James

Si vous traitez le «numéro de lot» comme fixe, vos déductions ne s'appliqueront qu'aux lots que vous avez déjà testés. Dans d'autres situations, le même genre de chose se produit. Si vous voulez faire des inférences sur les effets aléatoires, les traiter comme des effets fixes donnera généralement de mauvaises réponses. Dans de nombreuses situations de modèles mixtes, le traitement des effets aléatoires comme des effets fixes donnera même des réponses incorrectes concernant les effets qui sont réellement fixes.

— Emil Friedman

Ce n'est pas une question de hausse ou de baisse. Si l'on fait une analyse inappropriée, les résultats seront généralement incorrects.

— Emil Friedman

Pourriez-vous fournir une référence pour une étude de simulation qui a démontré comment le résultat devient incorrect en fonction de l'étiquette fixe / aléatoire?

— James

Notez également que MLE n'est pas gratuit, en particulier lorsque des composants de variance sont présents. Essayez de mettre en place un plan factoriel croisé avec 3 facteurs et quelques covariables continues. Essayez ensuite d'estimer un modèle fixe pur et quelques spécifications mixtes. Tant qu'il y a une composante aléatoire qui provoque un passage d'OLS à MLE / REML, les problèmes de convergence, d'obtention de composantes de variance nulle ou négative ou d'autres résultats dénués de sens sont plus probables.

— James

1

Vous les traitez donc comme aléatoires afin qu'il y ait un effet de moyenne entre la moyenne globale et la moyenne de ce facteur particulier en fonction de la taille de l'échantillon du facteur et du nombre total d'observations. Cela vous permet de dire que vos résultats s'appliquent à la population en général, car vous avez un type de moyenne pondérée et une estimation de la variation due à ce facteur, sinon, vous ne pouvez vraiment dire que vos résultats s'appliquent aux niveaux de facteur vous avez utilisé depuis la régression les traitera comme des facteurs discrets et non aléatoires qui obtiennent la moyenne pondérée.

Ils sont également utiles lorsque vous avez répété des mesures sur le même sujet, car vous pouvez les utiliser pour tenir compte de la corrélation entre les mesures sur le même sujet.

— Edward Fancher
source

Quant à RM, c'est l'une des raisons pour lesquelles j'ai posé la question en premier lieu. Comme je l'ai mentionné ici: stats.stackexchange.com/q/112640/54099 traiter le sujet comme fixe ou aléatoire ne change pas la valeur p du traitement, alors pourquoi s'embêter.

— James

Si vous avez une conception croisée simple avec un facteur fixe et un aléatoire et utilisez des carrés moyens attendus, la valeur de p pour le facteur fixe sera différente de ce que vous obtiendriez si vous les traitiez tous les deux comme fixes.

— Emil Friedman

1

$Y_{ij} = \beta_1 X_{ij} + \beta_2 Z_{i} + e_{i} + \mu_{ij}$ $X_{ij}$ $Z_{i}$ $\beta_2$ $Z_{i}$ $i$ $Z_{i}$

$Y_{ij} = \beta_1 X_{ij} + e_{i} + \mu_{ij}$ $Z_{i}$

$\beta_1$ $\beta_1$

(Réponse originale)

Un endroit où vous devez essentiellement utiliser des effets aléatoires est lorsque vous souhaitez inclure des paramètres invariants au niveau de regroupement de l'effet fixe.

Par exemple, supposons que vous souhaitiez étudier l'impact des caractéristiques du médecin (par exemple, la formation) sur les résultats pour les patients. L'ensemble de données est au niveau du patient avec les résultats observés et les caractéristiques du patient / médecin. Étant donné que les patients traités par un seul médecin sont probablement corrélés, vous devez contrôler cela. Vous pouvez insérer ici un effet fixe de médecin, mais ce faisant, vous excluez toute caractéristique du médecin dans le modèle. Ce qui est problématique si l'intérêt porte sur les caractéristiques de niveau médecin.

— Affine
source

Pourriez-vous fournir quelques déclarations modèles?

— James

0

Je pense que cela est lié à la cohérence des estimations.

$x_{ij} = a_i+b_j+e$ $a_i$

$b_j$

Neyman et Scott (1948) soulignent le problème de la cohérence des

$a_i$ $b_j$

cohérent. Du moins, c'est comme ça que j'ai compris ...

— KH Kim
source