Hypothèse nulle d'équivalence


11

Supposons que sont un simple échantillon aléatoire d'une distribution normale .X1,X2,...,Xn(μ,σ2)

Je suis intéressé à faire le test d'hypothèse suivant: pour une constante donnée .

H0:|μ|cH1:|μ|>c,
c>0

Je pensais effectuer deux tests unilatéraux (TOST) d'une manière analogue à la situation de test de bioéquivalence habituelle, où le zéro et est place, mais je ne sais pas si cela a du sens ou est correct.t|μ|c

Mon idée est de réaliser les tests unilatéraux et et rejetez l'hypothèse nulle globale si l'une des valeurs est inférieure à un niveau de signification .

H01:μcH11:μ>c
p α
H02:μcH12:μ<c,
pα

Merci d'avance!

ÉDITER:

J'y ai réfléchi un petit moment et je pense que l'approche que j'ai proposée n'a pas de niveau de signification .α

Supposons que la vraie valeur de est et est connue.μ 0 σ 2μμ0σ2

La probabilité de rejeter la valeur nulle dans le premier test est où si le cdf standard de la distribution normale, et est une valeur telle que .Φz1-αΦ(z1-α)=1-α

Pμ0(Rej.H01)=1Φ(z1α+cμ0σ/n),
Φz1αΦ(z1α)=1α

Si , . Ensuite, si , . Sinon, si , .P μ 0 ( R e j . H 01 ) = α μ 0 > c P μ 0 ( R e j . H 01 ) > α μ 0 < c P μ 0 ( R e j . H 01 ) < αμ0=cPμ0(Rej.H01)=αμ0>cPμ0(Rej.H01)>αμ0<cPμ0(Rej.H01)<α

La probabilité de rejeter la valeur nulle dans le deuxième test est

Pμ0(Rej.H02)=Φ(z1αμ0+cσ/n).

Encore une fois, si nous avons . De même, si , . Enfin, si , .P μ 0 ( R e j . H 02 ) = α μ 0 > - c P μ 0 ( R e j . H 02 ) < α μ 0 < - c P μ 0 ( R e j . H 02 ) > αμ0=cPμ0(Rej.H02)=αμ0>cPμ0(Rej.H02)<αμ0<cPμ0(Rej.H02)>α

Comme les régions de rejet des deux tests sont disjointes, la probabilité de rejet de est: P μ 0 ( R e j . H 0 ) = 1 - Φ ( z 1 - α + c - μ 0H0

Pμ0(Rej.H0)=1Φ(z1α+cμ0σ/n)+Φ(z1αμ0+cσ/n)

Donc, si , est une limite supérieure de la probabilité de rejeter l'hypothèse nulle (globale). Par conséquent, l'approche que j'ai proposée était trop libérale.2 αμ[c,c]2α

Si je ne me trompe pas, nous pouvons atteindre un niveau de signification de en faisant les deux mêmes tests et en rejetant la valeur nulle si la valeur de l'un d'entre eux est inférieure à . Un argument similaire est valable lorsque la variance est inconnue et nous devons appliquer le test .p α / 2 tαpα/2t


L'édition est sur la bonne voie :-).
whuber

Réponses:


3

Question très intéressante !!

Vous utilisez la conséquence logique, c'est-à-dire la condition d'implication. Cette condition d'implication forme la base même de la logique classique, elle garantit l'inférence ou la déduction d'un résultat à partir d'une prémisse.

Le raisonnement derrière votre proposition est le suivant:

Si implique , alors les données observées devraient tirer plus de preuves contre que .H0H0H0H0

En ce qui concerne vos hypothèses auxiliaires et , nous avons , c'est-à-dire que implique et également implique . Par conséquent, selon la condition d'implication, nous devrions observer plus de preuves contre que ou . Ensuite, vous avez conclu que si l'une des valeurs de p calculées sous ou est suffisamment petite, la valeur de p calculée sous sera encore plus petite. H 02 H 0H 01H 02 H 0H01H02H0H01H02H0H01H0H02H0H01H02H01H02H0

Cependant, ce raisonnement logique n'est pas valable pour les valeurs p, c'est-à-dire que les valeurs p ne respectent pas la conséquence logique. Chaque valeur de p est construite sous une hypothèse nulle spécifique, par conséquent, les valeurs de p pour différentes hypothèses nulles sont calculées sous différentes métriques. Pour cette raison, les valeurs de p ne peuvent pas respecter le raisonnement logique sur l'espace des paramètres (ou l'espace des hypothèses nulles).

Des exemples où les valeurs de p violent la condition d'implication sont présentés dans Schervish (1996) et Patriota (2013). Ce dernier article présente des exemples d'une distribution normale bivariée et d'un modèle de régression (voir respectivement les exemples 1.1 et 1.2 aux pages 5 et 6). Eran Raviv fournit un algorithme en code R pour le cas bivarié. L'apprentissage de ces exemples est le suivant: vous devez calculer la valeur de p directement pour l'hypothèse nulle d'intérêt. Schervish (1996) fournit une formule de valeur p pour votre exemple lorsque et , voir Formule (2) à la page 204. Si vous souhaitez calculer une valeur p, vous devez adapter cette formule pour ton cas.n=1σ2=1

Patriota (2013) propose une nouvelle mesure de preuve pour tester les hypothèses nulles générales (hypothèses nulles composites ou simples) qui respecte la conséquence logique. Cette mesure est appelée valeur s dans le document. La procédure est relativement simple pour votre exemple:

  1. Trouver un intervalle de confiance (1- ) pour (asymptotique): , où est la moyenne de l'échantillon, est la variance de l'échantillon , est le quantile d'une distribution normale standard et est la taille de l'échantillon.αμI(μ,α)=[x¯zα/2s2n ; x¯+zα/2s2n]x¯s2zα/2α/2n

  2. Trouvez la valeur pour laquelle l'amplitude de est minimale et a au moins un élément en commun avec (c'est-à-dire la frontière de ). Cette est la valeur .αI(μ,α){c,c}[c,c]αs

  3. D'une part, si , alors l'échantillon observé corrobore avec l'hypothèse nulle ; si la valeur est suffisamment petite, vous pouvez accepter la valeur null. D'un autre côté, si , alors l'échantillon observé fournit des informations sur l'hypothèse nulle ; si la valeur est suffisamment petite, vous pouvez rejeter la valeur nulle. Sinon, vous ne devez pas rejeter ou accepter la valeur nulle.x¯[c,c]H0:|μ|csx¯[c,c]H0s

Notez que, si et la valeur respective est extrêmement petite, cela signifie que l'hypothèse alternative est extrêmement éloignée de la valeur plausible maximale, . Si et la valeur respective est extrêmement petite, cela signifie que l'hypothèse nulle est extrêmement éloignée de la valeur plausible maximale, . Essayez de dessiner une image représentant l'intervalle de confiance et l'hypothèse nulle d'intérêt pour mieux comprendre les conclusions. Pour plus d'informations, veuillez lire l'article original Patriota (2013).x¯[c,c]sx¯x¯[c,c]sx¯

Comment trouver des seuils objectifs pour accepter ou rejeter le null en utilisant cette valeur est toujours un problème ouvert. Cette approche est intéressante car nous pouvons maintenant accepter une hypothèse nulle. Cela a du sens chaque fois que l'échantillon observé corrobore avec le zéro et qu'il est loin de l'alternative. Dans votre exemple, cela peut être vu pour , , et . Il est assez simple de voir que la densité des données est extrêmement concentrée sur (dix fois l'erreur standard). Pour avoir une intersection non vide avec il faut 99900 erreurs standard. Par conséquent, il serait assez juste d'accepterc = 1000 ˉ x = 1 s 2 = 1 n = 10000 [ 0,9 , 1,1 ] [ - 1000 , 1000 ] H 0 : | μ | csc=1000x¯=1s2=1n=10000[0.9, 1.1][1000, 1000]H0:|μ|c dans ce cas.

Les références:

Patriota, AG (2013). Une mesure classique de la preuve pour les hypothèses nulles générales, ensembles et systèmes flous, 233, 74–88

Schervish, MJ (1996). Valeurs P: ce qu'elles sont et ce qu'elles ne sont pas, The American Statistician, 50, 203-206.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.