(Sort Conover [1] de la bibliothèque ...)
Cette idée est assez ancienne; il remonte au moins à van der Waerden (1952/1953) [2] [3], qui a suggéré un test qui correspond au Kruskal Wallis mais avec des rangs remplacés par des scores normaux. (L'idée d'utiliser des valeurs normales aléatoires ordonnées plutôt qu'une approximation de leur attente ou de leur médiane - est peut-être même un peu plus ancienne.)
Selon Conover, Fisher et Yates (1957) [4] suggèrent de remplacer les observations par des scores normaux attendus (c'est-à-dire des rangs transformés) dans une variété de tests où la normalité serait supposée.
L'efficacité relative asymptotique à la normale sera de 1, ce qui le rend assez attrayant ... cependant, l'avantage par rapport au Wilcoxon-Mann-Whitney (gain de puissance) - même à la normale - est assez petit, et si la distribution est plus lourde que la normale (disons logistique), il peut être désavantageux de le faire. (Certaines simulations suggèrent que c'est en fait le cas: à moins que la distribution ne soit déjà proche de la normale - auquel cas il n'y a aucun avantage à effectuer la transformation - une telle transformation peut en fait perdre du pouvoir.)
Chernoff & Lehmann [5] calculent la puissance asymptotique pour une variété de distributions; où il y a au moins une queue très courte (comme l'uniforme), le test de score normal peut avoir beaucoup mieux ARE pour une alternative de décalage contre le Wilcoxon-Mann-Whitney - mieux que le test t lui-même. Leurs résultats concordent avec mes simulations pour les cas à queue plus lourde.
Notez que dans le cas de deux échantillons, comme la séparation dans les moyennes devient importante, alors que l'échantillon combiné semble tout à fait normal, les deux échantillons ne sont pas normaux du tout:
Par conséquent, toutes les propriétés du test normal ne seront pas transférées au test de score normal, et le comportement à des séparations plus importantes (avec de petits échantillons) peut être quelque peu contre-intuitif.
Les tests obtenus par cette idée sont parfois appelés collectivement tests de scores normaux , ce terme de recherche (via Google, par exemple) faisant apparaître un certain nombre de références.
Par exemple, ici , Richard Darlington explique comment le faire pour le test des rangs signés de Wilcoxon; il souligne qu'il y a un avantage sur le test de rang simple, car il réduit le nombre de valeurs liées de la statistique de test.
Avant de finir d'écrire des pages dessus, je vous laisse chercher plus loin.
Conover répertorie un certain nombre d'autres références et a beaucoup de discussions, donc je recommanderais certainement de lire cela.
Le point de Gelman, cependant, semble être sur la commodité - pas besoin de développer un nouveau test chaque fois que la situation change; mais si la commodité est le principal problème, il est déjà possible d'utiliser des tests de permutation sur n'importe quelle statistique que nous aimons. [Avec l'approche des scores normaux, la difficulté est que nous avons toujours besoin d'un moyen approprié pour classer - vous ne pouvez pas simplement classer les choses qui ne sont pas comparables sous le zéro et vous attendre au bon type de comportement. Il y a un problème similaire avec le test de permutation, car vous avez également besoin d'échangeabilité sous la valeur NULL.]
Vous mentionnez une fonction R, mais vous pouvez facilement classer et convertir en scores normaux dans R simplement en utilisant des fonctions déjà fournies avec R.
par exemple en utilisant les sleep
données dans R. vous feriez un test t de cette façon:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
Statistiques pratiques non paramétriques , 2e.
Wiley. pp. 316–327.
(À partir du lien Wikipédia ci-dessus, il semble que dans 3e (1999), la discussion commence à la p396)
[2] van der Waerden, BL (1952),
"Order tests for the two-sample problem and their power",
Actes de la Koninklijke Nederlandse Akademie van Wetenschappen , Série A 55 ( Indagationes Mathematicae 14 ), 453–458.
[3] van der Waerden, BL (1953),
"Order tests for the two-sample problem. II, III",
Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 & 311–316.
(il y a aussi des corrections à l'article de 1952 à la p 80 de ce volume)
[4] Fisher RA et Yates F. (1957)
Tableaux statistiques pour la recherche biologique, agricole et médicale , 5e, Oliver & Boyd, Édimbourg.
[5] Hodges, JL; Lehmann, EL (1961),
«Comparison of the Normal Scores and Wilcoxon Tests»,
Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, Volume 1: Contributions to the Theory of Statistics , 307-317,
University of California Press, Berkeley, Californie
http://projecteuclid.org/euclid.bsmsp/1200512171 .