Comment tester si


9

Supposons que j'ai trois groupes indépendants, avec respectivement .μ1, μ2, μ3

Comment puis-je tester si ou non en utilisant des échantillons de chaque groupe?μ1<μ2<μ3n1, n2, n3

Je souhaite connaître une méthodologie générale, pas un calcul détaillé. Je n'arrivais pas à comprendre comment définir mon hypothèse et .H0H1


1
Il s'agit d'un cas d' inférence statistique restreinte par ordre . Il existe des livres sur le sujet .
kjetil b halvorsen

1
Il y a aussi l'ancien livre de Barlow, Bartholemew, Bremner et Brunk Statistical inference under order restrictions (1973) (bien qu'il y ait eu des développements depuis lors); en ce qui concerne les tests non paramétriques, il y a le test de Jonckheere-Terpstra (par exemple voir Conover) et l'un des tests Match (essayez le livre de Neave et Worthington). Vous écririez généralement une égalité nulle et une alternative ordonnée.
Glen_b -Reinstate Monica


Ici, il faut dire, non pas que l'on a échantillons du groupe i , mais que l'on a un échantillon de taille n i du groupe i .nii,nii.
Michael Hardy

Réponses:


8

Dans les statistiques, vous ne pouvez pas tester si "X est vrai ou non". Vous ne pouvez essayer de trouver des preuves qu'une hypothèse nulle est fausse.

Disons que votre hypothèse nulle est

H01:μ1<μ2<μ3.
Supposons également que vous ayez une façon d'estimer le vecteur μ=(μ1,μ2,μ3) . Pour garder les choses, supposons simplement que vous avez un estimateur
xN(μ,Σ),
Σ est une matrice de covariables 3×3 . Nous pouvons réécrire l'hypothèse nulle comme
Aμ<0,
A=[110011].
Cela montre que votre hypothèse nulle peut être exprimée comme une restriction d'inégalité sur le vecteurAμ . Un estimateur naturel deAμ est donné par
AxN(Aμ,AΣA).
Vous pouvez maintenant utiliser le framework pour tester la contrainte d'inégalité sur des vecteurs normaux donnée dans:

Kudo, Akio (1963). «Un analogue multivarié du test unilatéral». Dans: Biometrika 50,3 / 4, pp. 403–418.

Ce test fonctionnera également si l'hypothèse de normalité ne tient que approximativement ("asymptotiquement"). Par exemple, cela fonctionnera si vous pouvez tirer des échantillons de moyennes des groupes. Si vous dessinez des échantillons de taille n1,n2,n3 et si vous pouvez dessiner indépendamment des groupes, alors Σ est une matrice diagonale à diagonale

(σ12/n1,σ22/n2,σ32/n3),
σk2est la variance dans le groupe k=1,2,3 . Dans une application, vous pouvez utiliser la variance d'échantillon au lieu de la variance de population inconnue sans modifier les propriétés du test.

H12:μ1<μ2<μ3
H02:NOT H1.
H1:Aμ<0
H02:there exists a k=1,2 such that (Aμ)k0.
H0,12:(Aμ)10.
H0,22:(Aμ)20.
H0H0H0Σ

H02

H02:maxk=1,2(Aμ)k0.
maxAx


Assez juste, j'ai édité ma réponse.
Andreas Dzemski

Bonne réponse (+1). Juste pour l'améliorer un peu plus, je recommanderais de remplacer par afin que la notation reflète l'intention que cet objet soit un estimateur pour . um umxμ^μ
Ben - Réintègre Monica le

1

La réponse fournie par @ andreas-dzemski n'est correcte que si nous savons que les données sont normalement distribuées.

Si nous ne connaissons pas la distribution, je pense qu'il serait préférable d'exécuter un test non paramétrique. Dans ce cas, le plus simple semble exécuter un test de permutation. C'est un livre sur le sujet et c'est une bonne explication en ligne. Ci-dessous, j'inclus le code R pour calculer ce test.

# some test data
D <- data.frame(group1=c(3,6,2,2,3,9,3,4,2,5), group2=c(5,3,10,1,10,2,4,4,2,2), group3=c(8,0,1,5,10,7,3,4,8,1))

# sample with replacement
resample <- function(X) sample(X, replace=TRUE)

# return true if mu1 < mu2 < mu3
test     <- function(mu1, mu2, mu3) (mu1 < mu2) & (mu2 < mu3)

# resampling test that returns the probability of observing the relationship
mean(replicate(1000, test(mean(resample(D$group1)), mean(resample(D$group2)), mean(resample(D$group3)))))
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.