Je sais que non paramétrique s'appuie sur la médiane au lieu de la moyenne
Pratiquement aucun test non paramétrique "ne repose" sur des médianes dans ce sens. Je ne peux penser qu'à un couple ... et le seul dont je pense que vous auriez probablement entendu parler serait le test des signes.
comparer ... quelque chose.
S'ils s'appuyaient sur des médianes, ce serait probablement pour comparer les médianes. Mais - malgré ce que plusieurs sources essaient de vous dire - des tests comme le test de classement signé, ou le Wilcoxon-Mann-Whitney ou le Kruskal-Wallis ne sont pas du tout un test des médianes; si vous faites des hypothèses supplémentaires, vous pouvez considérer le Wilcoxon-Mann-Whitney et le Kruskal-Wallis comme des tests de médianes, mais selon les mêmes hypothèses (tant que les moyens de distribution existent), vous pouvez également les considérer comme un test de moyens .
L'estimation de localisation réelle pertinente pour le test du rang signé est la médiane des moyennes par paire au sein de l'échantillon, celle de Wilcoxon-Mann-Whitney (et par implication, dans Kruskal-Wallis) est la médiane des différences par paire entre les échantillons .
Je crois aussi que cela repose sur des "degrés de liberté?" au lieu de l'écart-type. Corrigez-moi si je me trompe.
La plupart des tests non paramétriques n'ont pas de `` degrés de liberté '', bien que la distribution de beaucoup change avec la taille de l'échantillon et vous pourriez considérer cela comme quelque peu apparenté aux degrés de liberté dans le sens où les tableaux changent avec la taille de l'échantillon. Les échantillons conservent bien sûr leurs propriétés et ont n degrés de liberté dans ce sens, mais les degrés de liberté dans la distribution d'une statistique de test ne nous concernent généralement pas. Il peut arriver que vous ayez quelque chose de plus comme des degrés de liberté - par exemple, vous pourriez certainement faire valoir que le Kruskal-Wallis a effectivement des degrés de liberté dans le même sens qu'un khi carré, mais il n'est généralement pas examiné de cette façon (par exemple, si quelqu'un parle des degrés de liberté d'un Kruskal-Wallis, ils signifieront presque toujours le df
Une bonne discussion des degrés de liberté peut être trouvée ici /
J'ai fait de très bonnes recherches, c'est du moins ce que j'ai pensé, en essayant de comprendre le concept, ce que le fonctionnement est derrière, ce que les résultats des tests signifient vraiment, et / ou quoi faire même avec les résultats des tests; cependant, personne ne semble jamais s'aventurer dans ce domaine.
Je ne sais pas ce que tu veux dire par là.
Je pourrais suggérer quelques livres, comme Conover's Practical Nonparametric Statistics , et si vous pouvez l'obtenir, le livre de Neave et Worthington ( Distribution-Free Tests ), mais il y en a beaucoup d'autres - Marascuilo & McSweeney, Hollander & Wolfe, ou le livre de Daniel par exemple. Je vous suggère de lire au moins 3 ou 4 de ceux qui vous parlent le mieux, de préférence ceux qui expliquent les choses aussi différemment que possible (cela signifierait au moins lire un peu de peut-être 6 ou 7 livres pour trouver disons 3 qui conviennent).
Par souci de simplicité, respectons le test de Mann Whitney U, que j'ai remarqué comme très populaire
C'est ce qui m'a intrigué dans votre déclaration "personne ne semble jamais s'aventurer dans ce domaine" - de nombreuses personnes qui utilisent ces tests "s'aventurent dans le domaine" dont vous parliez.
- et aussi apparemment mal utilisé et surutilisé
Je dirais que les tests non paramétriques sont généralement sous - utilisés si quelque chose (y compris les tests de Wilcoxon-Mann-Whitney) - plus particulièrement les tests de permutation / randomisation, bien que je ne contesterais pas nécessairement qu'ils sont fréquemment mal utilisés (mais les tests paramétriques le sont aussi, même d'autant plus).
Supposons que j'exécute un test non paramétrique avec mes données et que j'obtiens ce résultat:
[couper]
Je connais d'autres méthodes, mais qu'est-ce qui est différent ici?
De quelles autres méthodes parlez-vous? À quoi voulez-vous que je compare cela?
Edit: Vous mentionnez la régression plus tard; Je suppose donc que vous connaissez un test t à deux échantillons (car c'est vraiment un cas particulier de régression).
Selon les hypothèses du test t ordinaire à deux échantillons, l'hypothèse nulle veut que les deux populations soient identiques, contre l'alternative selon laquelle l'une des distributions a changé. Si vous regardez le premier des deux ensembles d'hypothèses pour le Wilcoxon-Mann-Whitney ci-dessous, la chose de base testée est presque identique; c'est juste que le test t est basé sur l'hypothèse que les échantillons proviennent de distributions normales identiques (en dehors d'un éventuel changement de lieu). Si l'hypothèse nulle est vraie et que les hypothèses qui l'accompagnent sont vraies, la statistique de test a une distribution t. Si l'hypothèse alternative est vraie, alors la statistique de test devient plus susceptible de prendre des valeurs qui ne semblent pas cohérentes avec l'hypothèse nulle mais semblent cohérentes avec l'alternative - nous nous concentrons sur la plus inhabituelle,
La situation est très similaire avec celle de Wilcoxon-Mann-Whitney, mais elle mesure l'écart de la valeur nulle quelque peu différemment. En fait, lorsque les hypothèses du test t sont vraies *, c'est presque aussi bon que le meilleur test possible (qui est le test t).
* (ce qui n'est jamais le cas en pratique, bien que ce ne soit pas vraiment autant un problème qu'il y paraît)
En effet, il est possible de considérer le Wilcoxon-Mann-Whitney comme un "test t" efficace effectué sur les rangs des données - bien qu'il n'ait alors pas de distribution t; la statistique est une fonction monotone d'une statistique t à deux échantillons calculée sur les rangs des données, donc elle induit le même ordre ** sur l'espace d'échantillonnage (c'est-à-dire un "test t" sur les rangs - correctement exécuté - générerait les mêmes valeurs de p qu'un Wilcoxon-Mann-Whitney), il rejette donc exactement les mêmes cas.
** (strictement, commande partielle, mais laissons cela de côté)
[On pourrait penser que le simple fait d'utiliser les rangs jetterait beaucoup d'informations, mais lorsque les données sont tirées de populations normales avec la même variance, presque toutes les informations sur le changement de lieu se trouvent dans les schémas des rangs. Les valeurs réelles des données (conditionnelles à leur classement) ajoutent très peu d'informations supplémentaires à cela. Si vous allez plus lourd que la normale, il ne faut pas longtemps avant que le test de Wilcoxon-Mann-Whitney ait un meilleur pouvoir, tout en conservant son niveau de signification nominal, de sorte que les informations supplémentaires au-dessus des rangs finissent par devenir non seulement non informatives, mais dans certains sens, trompeur. Cependant, la queue lourde presque symétrique est une situation rare; ce que vous voyez souvent dans la pratique, c'est l'asymétrie.]
Les idées de base sont assez similaires, les valeurs p ont la même interprétation (la probabilité d'un résultat, ou plus extrême, si l'hypothèse nulle était vraie) - jusqu'à l'interprétation d'un changement de lieu, si vous faites les hypothèses requises (voir la discussion des hypothèses vers la fin de ce post).
Si je faisais la même simulation que dans les graphiques ci-dessus pour le test t, les graphiques sembleraient très similaires - l'échelle sur les axes x et y serait différente, mais l'apparence de base serait similaire.
Devrions-nous vouloir que la valeur p soit inférieure à 0,05?
Vous ne devriez pas "vouloir" quoi que ce soit là-bas. L'idée est de savoir si les échantillons sont plus différents (dans un sens géographique) que ce qui peut être expliqué par hasard, et non de «souhaiter» un résultat particulier.
Si je dis « Peux - tu aller voir la couleur de la voiture de Raj est s'il vous plaît? », Si je veux une évaluation impartiale de ce que je ne veux pas que tu sois allez « Mec, je vraiment, espérons vraiment que c'est bleu! Il juste doit être bleu". Mieux vaut simplement voir quelle est la situation, plutôt que d'aller avec certains «j'ai besoin que ce soit quelque chose».
Si le niveau de signification choisi est 0,05, vous rejetterez l'hypothèse nulle lorsque la valeur p est inférieure à 0,05. Mais ne pas rejeter lorsque vous avez une taille d'échantillon suffisamment grande pour détecter presque toujours les tailles d'effet pertinentes est au moins aussi intéressant, car cela dit que toutes les différences qui existent sont petites.
Que signifie le numéro "mann whitley"?
La statistique de Mann-Whitney .
Cela n'a vraiment de sens que par rapport à la distribution des valeurs qu'il peut prendre lorsque l'hypothèse nulle est vraie (voir le diagramme ci-dessus), et cela dépend de la définition de plusieurs programmes particuliers qu'un programme particulier pourrait utiliser.
Y a-t-il une utilité?
Habituellement, vous ne vous souciez pas de la valeur exacte en tant que telle, mais où elle se trouve dans la distribution nulle (que ce soit plus ou moins typique des valeurs que vous devriez voir lorsque l'hypothèse nulle est vraie, ou si elle est plus extrême)
(Modifier: vous pouvez obtenir ou calculer des quantités directement informatives lors d'un tel test - comme le décalage d'emplacement ou discuté ci-dessous, et en effet, vous pouvez calculer le second assez directement à partir de la statistique, mais le la statistique seule n'est pas un nombre très informatif)P( X< O)
Est-ce que ces données ici vérifient simplement ou non qu'une source de données particulière que je possède devrait ou ne devrait pas être utilisée?
Ce test ne dit rien sur "une source particulière de données que je dois ou ne devrait pas être utilisée".
Voir ma discussion sur les deux façons d'examiner les hypothèses WMW ci-dessous.
J'ai une quantité raisonnable d'expérience avec la régression et les bases, mais je suis très curieux à propos de ce truc non paramétrique "spécial"
Les tests non paramétriques n'ont rien de particulièrement spécial (je dirais que les tests `` standard '' sont à bien des égards encore plus fondamentaux que les tests paramétriques typiques) - tant que vous comprenez réellement les tests d'hypothèse.
C'est probablement un sujet pour une autre question, cependant.
Il existe deux façons principales d'examiner le test d'hypothèse de Wilcoxon-Mann-Whitney.
i) L'une consiste à dire «je m'intéresse au changement de lieu - c'est-à-dire que sous l'hypothèse nulle, les deux populations ont la même distribution (continue) , contre l'alternative selon laquelle l'une est« décalée »vers le haut ou vers le bas par rapport à la autre"
Le Wilcoxon-Mann-Whitney fonctionne très bien si vous faites cette hypothèse (que votre alternative n'est qu'un changement de lieu)
Dans ce cas, le Wilcoxon-Mann-Whitney est en fait un test pour les médianes ... mais c'est également un test pour les moyennes, ou en fait toute autre statistique équivariante à l'emplacement (90e centiles, par exemple, ou moyennes ajustées, ou n'importe quel nombre de d'autres choses), car ils sont tous affectés de la même manière par le changement d'emplacement.
La bonne chose à ce sujet est qu'il est très facilement interprétable - et il est facile de générer un intervalle de confiance pour ce changement d'emplacement.
Cependant, le test de Wilcoxon-Mann-Whitney est sensible à d'autres types de différence qu'un changement d'emplacement.
ii) L'autre consiste à adopter une approche entièrement générale. Vous pouvez caractériser cela comme un test pour la probabilité qu'une valeur aléatoire de la population 1 soit inférieure à une valeur aléatoire de la population 2 (et en effet, vous pouvez transformer votre statistique de Wilcoxon-Mann-Whitney en une estimation directe de cette probabilité, si vous sont tellement enclins; la formulation de Mann & Whitney en termes de statistiques U compte le nombre de fois où l'une dépasse l'autre dans les échantillons, vous n'avez besoin que d'une échelle pour obtenir une estimation de la probabilité); la valeur nulle est que la probabilité de population est , contre l'alternative qu'elle diffère de .1212