J'ai fouillé un peu dans les archives de Cross Validated et je n'ai pas semblé trouver de réponse à ma question. Ma question est la suivante: Wikipedia donne trois hypothèses qui doivent être vérifiées pour le test de classement signé de Wilcoxon (légèrement modifié pour mes questions):
Soit Zi = Xi-Yi pour i = 1, ..., n.
Les différences Zi sont supposées indépendantes.
(a.) Chaque Zi provient de la même population continue, et (b.) chaque Zi est symétrique par rapport à une médiane commune;
Les valeurs que représentent Xi et Yi sont ordonnées ... donc les comparaisons «supérieur à», «inférieur à» et «égal à» sont utiles.
Cependant, la documentation de? Wilcox.test dans R semble indiquer que (2.b) est en fait quelque chose qui est testé par la procédure:
"... si x et y sont donnés et que l'appariement est VRAI, un test de rang signé par Wilcoxon de la valeur nulle que la distribution ... de x - y (dans le cas de l'échantillon à deux paires) est symétrique par rapport à mu est effectué."
Cela me semble comme si le test est effectué pour l'hypothèse nulle que "Z est distribué symétriquement autour de mu médian = SomeMu" - de telle sorte que le rejet du nul pourrait être soit un rejet de la symétrie soit un rejet que le mu autour duquel Z est symétrique est SomeMu.
Est-ce une compréhension correcte de la documentation R pour wilcox.test? La raison pour laquelle cela est important, bien sûr, c'est que je fais un certain nombre de tests de différence par paires sur certaines données avant et après ("X" et "Y" ci-dessus). Les données «avant» et «après» individuellement sont fortement asymétriques, mais les différences ne sont pas autant asymétriques (bien qu'elles soient encore quelque peu asymétriques). J'entends par là que les données "avant" ou "après" considérées seules ont une asymétrie ~ 7 à 21 (selon l'échantillon que je regarde), tandis que les données "différences" ont une asymétrie ~ = 0,5 à 5. Toujours asymétriques, mais pas autant.
Si une asymétrie dans mes données de "différences" fait que le test de Wilcoxon me donne des résultats faux / biaisés (comme l'article Wikipedia semble l'indiquer), alors l'asymétrie pourrait être une grande préoccupation. Si, cependant, les tests de Wilcoxon testent réellement si la distribution des différences est "symétrique autour de mu = SomeMu" (comme semble l'indiquer? Wilcox.test), alors cela est moins préoccupant.
Ainsi mes questions sont:
Quelle interprétation ci-dessus est correcte? Est-ce que l'asymétrie dans ma distribution des «différences» va biaiser mon test de Wilcoxon?
Si l'asymétrie est une préoccupation: "Quelle est l'asymétrie?"
Si les tests de classement signés par Wilcoxon semblent vraiment inappropriés ici, des suggestions sur ce que je devrais utiliser?
Merci beaucoup. Si vous avez d'autres suggestions sur la façon dont je pourrais faire cette analyse, je suis plus qu'heureux de les entendre (bien que je puisse également ouvrir un autre fil à cet effet). Aussi, c'est ma première question sur la validation croisée; si vous avez des suggestions / commentaires sur la façon dont j'ai posé cette question, je suis ouvert à cela aussi!
Un peu d'histoire: j'analyse un ensemble de données qui contient des observations sur ce que j'appellerai des "erreurs de production ferme". J'ai une observation sur les erreurs survenant dans le processus de production avant et après une inspection surprise, et l'un des objectifs de l'analyse est de répondre à la question "L'inspection fait-elle une différence dans le nombre d'erreurs observées?"
L'ensemble de données ressemble à ceci:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
Il y a environ 4000 observations. Les autres variables sont des observations catagoriques qui décrivent les caractéristiques des entreprises. La taille peut être petite, moyenne ou grande, et chaque entreprise en est une et une seule. Les entreprises peuvent être tout ou partie des «types».
On m'a demandé d'effectuer des tests simples pour voir s'il y avait des différences statistiquement significatives dans les taux d'erreur observés avant et après les inspections pour toutes les entreprises et divers sous-groupes (en fonction de la taille et du type). Les tests T étaient sortis car les données étaient gravement biaisées avant et après, par exemple, dans R, les données avant ressemblaient à ceci:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(Ceux-ci sont constitués - je crains de ne pas pouvoir publier les données réelles ou toute manipulation réelle à cause de problèmes de propriété / confidentialité - mes excuses!)
Les différences appariées étaient plus centralisées mais toujours pas très bien ajustées par une distribution normale - beaucoup trop culminée. Les données sur les différences ressemblaient à ceci:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
Il a été suggéré d'utiliser un test de classement signé par Wilcoxon, et après une brève persusale de? Wilcox.test et Wikipedia, et ici, cela semble être le test à utiliser. Compte tenu des hypothèses ci-dessus, je pense que (1) est bien compte tenu du processus de génération de données. L'hypothèse (2.a) n'est pas strictement vraie pour mes données, mais la discussion ici: Alternative au test de Wilcoxon lorsque la distribution n'est pas continue? semblait indiquer que ce n'était pas trop une préoccupation. L'hypothèse (3) est très bien. Ma seule préoccupation (je crois) est l'Assomption (2.b).
Une note supplémentaire , quelques années plus tard: j'ai finalement suivi un excellent cours de statistiques non paramétriques et j'ai passé beaucoup de temps sur les tests de classement. Dans l'hypothèse (2.a), «chaque Zi provient de la même population continue», l'idée est que les deux échantillons doivent provenir de populations de variance égale - cela s'avère extrêmement important, pratiquement parlant. Si vous avez des inquiétudes au sujet de la variance différente dans vos populations (à partir de laquelle vous tirez les échantillons), vous devriez être préoccupé par l'utilisation de WMW.