Si la déclaration d'origine ne limite pas sensiblement les conditions dans lesquelles elle s'applique, Field a tout simplement tort.
Répondant à la section citée:
En fait, cela signifie qu'il fait à peu près la même chose que le test de Mann – Whitney!
Non, ce n'est vraiment pas le cas. Ils testent vraiment différents types de choses. À titre d'exemple, si deux distributions proches de symétriques diffèrent dans la répartition mais ne diffèrent pas dans l'emplacement, le Kolmogorov-Smirnov peut identifier ce genre de différence (dans des échantillons suffisamment grands par rapport à l'effet), mais le Wilcoxon-Mann-Whitney ne peut pas.
C'est parce qu'ils sont conçus à des fins différentes.
"Cependant, ce test a tendance à avoir une meilleure puissance que le test de Mann – Whitney lorsque la taille des échantillons est inférieure à environ 25 par groupe, et vaut donc la peine d'être sélectionné si c'est le cas."
En règle générale, cela n'a aucun sens. Contre les choses que le Mann-Whitney ne teste pas, il a un meilleur pouvoir, mais contre les choses auxquelles le Mann-Whitney est destiné, il ne le fait pas. Cela ne change pas lorsque .n<25
[Il peut y avoir une situation où la demande est vraie; si Field n'explique pas dans quel contexte sa réclamation s'applique, je ne serai probablement pas en mesure de le deviner.]
Voici une courbe de puissance pour n = 20 par groupe. Le niveau de signification est un peu plus de 3% pour chaque test (en fait, le niveau de signification réalisable pour le KS est légèrement plus élevé et je n'ai pas essayé d'utiliser un test randomisé pour ajuster cette différence, donc il a été donné un petit avantage dans cette comparaison ):
Comme nous le voyons, dans ce cas (le premier que j'ai essayé), le Wilcoxon-Mann-Whitney est clairement plus puissant.
À n = 5, le Kolmogorov-Smirnov reste moins puissant pour cette situation. [Alors de quoi diable parle-t-il? Compare-t-il le pouvoir à une situation non mentionnée dans la citation? Je ne sais pas, mais pour ce qui est de ce qui est cité ici, nous ne devons pas prendre cette affirmation pour argent comptant. C'était mal dans la première chose que j'ai vérifiée, et - sur la base d'une connaissance plus large des deux tests, je parierais volontiers que c'est mal pour un tas d'autres situations.]
Aux tailles d'échantillon de 4 et 11 pour les alternatives de quart (et les populations normales), encore une fois, le Wilcoxon-Mann-Whitney fait mieux.
Avec la variable que vous regardez, une alternative appropriée est probablement quelque chose de plus comme un changement d'échelle; mais si une certaine puissance (comme une racine carrée ou une racine de cube ou mieux encore un journal) de vos données n'est pas trop anormale, ces résultats que je mentionne devraient être pertinents. Si vous avez des données discrètes ou gonflées à zéro qui peuvent faire une différence, mais je parie que le Kolmogorov-Smirnov ne dépasse pas le Wilcoxon-Mann-Whitney alors non plus. [Je ne poursuivrai pas cela pour le moment car il n'est pas clair si cela est pertinent pour votre situation.]
De plus, les niveaux de signification atteignables avec le Kolmogorov-Smirnov sont très espacés pour les petits échantillons. Souvent, vous ne pouvez pas obtenir des tests proches des niveaux de signification habituels que vous voudrez probablement. (Le WMW fait beaucoup mieux que le KS en ce qui concerne les tailles de test disponibles. Il existe un moyen judicieux d'améliorer considérablement cette situation de niveaux de niveaux sans perdre la nature non paramétrique ou basée sur le classement de tests comme ceux-ci - cela ne fait pas non plus impliquent des tests randomisés - mais il semble être très rarement utilisé pour une raison quelconque.)
Notez que j'ai soigneusement choisi des exemples qui ont rendu les niveaux des deux tests presque comparables. Si vous êtes juste choisir à chaque fois sans tenir compte des niveaux disponibles et en comparant une valeur de p à celle, le gappiness des niveaux réalisables de Kolmogorov-Smirnov va faire son pouvoir bien pire en général (bien que la volonté très occasionnellement, aidez-le un peu comme ici - ces avantages ne seront généralement pas beaucoup cependant et probablement pas suffisants pour l'aider à battre le WMW à la tâche pour laquelle il est adapté).α=0.05
Si vous êtes dans une situation où le Wilcoxon-Mann-Whitney teste ce que vous voulez tester, je ne recommanderais certainement pas d'utiliser le Kolmogorov-Smirnov à la place. J'utiliserais chaque test pour ce qu'ils sont conçus pour tester, c'est là qu'ils ont tendance à faire assez bien.
La meilleure façon de déterminer ce qui est le mieux est d'essayer des simulations dans des situations qui seraient réalistes pour le type de données que vous aurez. Ensuite, vous pouvez voir quand il fait quoi.
De même, lors de la déclaration des apports avec les valeurs de p, dois-je utiliser la moyenne et l'écart-type ou la médiane et l'IQR car les données ne sont pas paramétriques?
Les données ne sont que des données. Ils ne sont ni paramétriques ni non paramétriques - c'est une propriété des modèles et des procédures inférentielles que nous utilisons qui s'appuient sur eux (estimation, test, intervalles). Paramétrique signifie "défini jusqu'à un nombre fini et fixe de paramètres", qui n'est pas un attribut de données mais de modèles. Si vous ne pouvez pas simplement donner les deux ensembles de valeurs (ce qui serait ma préférence) et devez plutôt choisir l'un ou l'autre, ce qui est plus pertinent scientifiquement ou par rapport à votre question d'intérêt?
[Notez que le Wilcoxon-Mann-Whitney ne compare ni les moyennes ni les médianes (sauf si vous ajoutez des hypothèses que je parie ne sont pas près de s'appliquer dans ce cas). Le Kolmogorov-Smirnov non plus.]