Juste pour amplifier - je suis le demandeur le plus récent, je crois.
En commentaire spécifique sur les points de Mike:
Il est clairement vrai que la différence I / II / III ne s'applique qu'aux prédicteurs corrélés (dont les plans déséquilibrés sont l'exemple le plus courant, certainement dans l'ANOVA factorielle) - mais cela me semble être un argument qui rejette l'analyse de la situation déséquilibrée (et donc tout débat de type I / II / III). Cela peut être imparfait, mais c'est ainsi que les choses se passent (et dans de nombreux contextes, les coûts de la collecte de données supplémentaires l'emportent sur le problème statistique, malgré les mises en garde).
C'est tout à fait juste et représente la chair de la plupart des arguments "II contre III, favorisant II" que j'ai rencontrés. Le meilleur résumé que j'ai rencontré est Langsrud (2003) "ANOVA pour les données déséquilibrées: utilisez le type II au lieu des sommes de carrés de type III", Statistics and Computing 13: 163-167 (J'ai un PDF si l'original est difficile à trouver ). Il soutient (en prenant le cas des deux facteurs comme exemple de base) que s'il y a une interaction, il y a une interaction, donc la prise en compte des effets principaux n'a généralement pas de sens (un point évidemment juste) - et s'il n'y a pas d'interaction, l'analyse de type II de les effets principaux sont plus puissants que le Type III (sans aucun doute), vous devriez donc toujours opter pour le Type II. J'ai vu d'autres arguments (par exemple Venables,
Et je suis d'accord avec cela: si vous avez une interaction mais que vous avez également des questions sur l'effet principal, vous êtes probablement sur le territoire du bricolage.
Il y a clairement ceux qui veulent juste le type III parce que SPSS le fait, ou une autre référence à l'autorité supérieure statistique. Je ne suis pas entièrement contre ce point de vue, si cela se résume à un choix de beaucoup de gens qui s'en tiennent à SPSS (contre lequel j'ai certaines choses, à savoir du temps, de l'argent et des conditions d'expiration de licence) et de Type III SS, ou beaucoup de les gens qui passent à R et Type III SS. Cependant, cet argument est clairement boiteux statistiquement.
Cependant, l'argument que j'ai trouvé plutôt plus substantiel en faveur du type III est celui avancé de manière indépendante par Myers & Well (2003, "Research Design and Statistical Analysis", pp. 323, 626-629) et Maxwell & Delaney (2004, " Designing Experiments and Analyzing Data: A Model Comparison Perspective ", pp. 324-328, 332-335). C'est comme suit:
- s'il y a une interaction, toutes les méthodes donnent le même résultat pour la somme d'interaction des carrés
- Le type II suppose qu'il n'y a pas d'interaction pour son test des effets principaux; le type III ne
- Certains (par exemple Langsrud) soutiennent que si l'interaction n'est pas significative, alors vous avez raison de supposer qu'il n'y en a pas, et de regarder les effets principaux (plus puissants) de Type II
- Mais si le test de l'interaction est sous-alimenté, mais qu'il y a une interaction, l'interaction peut apparaître "non significative" tout en conduisant à une violation des hypothèses du test des effets principaux de type II, biaisant ces tests pour qu'ils soient trop libéraux. .
- Myers & Well citent Appelbaum / Cramer comme les principaux partisans de l'approche de type II, et continuent [p323]: "... Des critères plus conservateurs pour la non-signification de l'interaction pourraient être utilisés, comme exiger que l'interaction ne soit pas significative à niveau 0,25, mais les conséquences de cette approche ne sont pas encore suffisamment comprises. En règle générale, les sommes de sqaures de type II ne doivent pas être calculées à moins qu'il y ait une raison a priori forte de ne supposer aucun effet d'interaction et une interaction clairement non significative. somme des carrés." Ils citent [p629] Globalement, Lee et Hornick 1981 comme une démonstration que les interactions qui ne se rapprochent pas de la signification peuvent biaiser les tests des effets principaux. Maxwell & Delaney [p334] préconisent l'approche de type II si l'interaction de la population est nulle, pour la puissance, et l'approche de type III si ce n'est [pour l'interprétabilité des moyens dérivés de cette approche]. Ils préconisent également d'utiliser le type III dans la situation réelle (lorsque vous faites des inférences sur la présence de l'interaction à partir des données) en raison du problème de faire une erreur de type 2 [sous-alimenté] dans le test d'interaction et donc de violer accidentellement les hypothèses de l'approche SS de type II; ils font ensuite des remarques similaires à Myers & Well, et notent le long débat sur cette question! faire des inférences sur la présence de l'interaction à partir des données) en raison du problème de commettre une erreur de type 2 [sous-alimenté] dans le test d'interaction et donc de violer accidentellement les hypothèses de l'approche SS de type II; ils font ensuite des remarques similaires à Myers & Well, et notent le long débat sur cette question! faire des inférences sur la présence de l'interaction à partir des données) en raison du problème de commettre une erreur de type 2 [sous-alimenté] dans le test d'interaction et donc de violer accidentellement les hypothèses de l'approche SS de type II; ils font ensuite des remarques similaires à Myers & Well, et notent le long débat sur cette question!
Donc, mon interprétation (et je ne suis pas un expert!) Est qu'il y a beaucoup d'autorité statistique supérieure des deux côtés de l'argument; que les arguments habituels avancés ne concernent pas la situation habituelle qui poserait problème (cette situation étant la plus courante d'interprétation des effets principaux avec une interaction non significative); et qu'il y a de bonnes raisons de s'inquiéter de l'approche de type II dans cette situation (et cela revient à un rapport pouvoir / libéralisme potentiel).
Pour moi, c'est suffisant pour souhaiter l'option Type III dans ezANOVA, ainsi que Type II, car (pour mon argent) c'est une superbe interface avec les systèmes ANOVA de R. R est loin d'être facile à utiliser pour les novices, à mon avis, et le package "ez", avec ezANOVA et les fonctions de traçage des effets plutôt charmantes, contribue grandement à rendre R accessible à un public de recherche plus général. Certaines de mes pensées en cours (et un méchant hack pour ezANOVA) sont à http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Serait intéressé d'entendre les pensées de tout le monde!