Oui et non.
D'abord le "oui"
Ce que vous avez observé, c'est que lorsqu'un test et un intervalle de confiance sont basés sur la même statistique, il y a une équivalence entre eux: on peut interpréter la valeur comme la plus petite valeur de α pour laquelle la valeur nulle du paramètre serait être inclus dans l' intervalle de confiance 1 - α .pα1−α
Soit un paramètre inconnu dans l'espace des paramètres Θ ⊆ R , et que l'échantillon x = ( x 1 , … , x n ) ∈ X n ⊆ R n soit une réalisation de la variable aléatoire X = ( X 1 , … , X n ) . Pour simplifier, définir un intervalle de confiance I α ( X ) comme un intervalle aléatoire tel que sa probabilité de couverture P θθΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
(Vous pouvez également considérer des intervalles plus généraux, où la probabilité de couverture est limitée par ou approximativement égale à 1 - α . Le raisonnement est analogue.)
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α
Considérons un test bilatéral de l'hypothèse ponctuelle nulle contre l'alternative H 1 ( θ 0 ) : θ ≠ θ 0 . Soit λ ( θ 0 , x ) la valeur de p du test. Pour tout α ∈ ( 0 , 1 ) , H 0 ( θ 0 ) est rejeté au niveau α siH0(θ0):θ=θ0H1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)α . Larégion de rejet deniveau α est l'ensemble de x qui conduit au rejet de H 0 ( θ 0 ) :
R α ( θ 0 ) = { x ∈ R n : λ ( θ 0 , x ) ≤ α } .λ(θ0,x)≤αα xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Considérons maintenant une famille de tests bilatéraux avec des valeurs de p , pour θ ∈ Θ . Pour une telle famille, nous pouvons définir une région de rejet inversée Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
Pour tout fixe , H 0 ( θ 0 ) est rejeté si x ∈ R α ( θ 0 ) , ce qui se produit si et seulement si θ 0 ∈ Q α ( x ) , c'est-à-dire
x ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) .
Si le test est basé sur une statistique de test avec une distribution nulle absolument continue complètement spécifiée, alorsθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
sous
H 0 ( θ 0 ) . Alors
P θ 0 ( X ∈ R α ( θ 0 ) ) = P θ 0 ( λ ( θ 0 , X ) ≤ α ) = α .
Puisque cette équation est valable pour tout
θ 0 ∈ Θλ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θet puisque l'équation ci-dessus implique que
il s'ensuit que l'ensemble aléatoire
Q α ( x ) couvre toujours le vrai paramètre
θ 0 avec probabilité
α . Par conséquent, en laissant
Q C α ( x ) désigner le complément de
QPθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0αQCα(x) , pour tout
θ 0 ∈ Θ nous avons
P θ 0 ( θ 0 ∈ Q C α ( X ) ) = 1 - α ,
ce qui signifie que le complément de la région de rejet inversé est unintervalle de confiance
1 - α pour
θ .
Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Une grande partie de cela est tirée de ma thèse de doctorat .)
Maintenant pour le "non"
θX
Ce phénomène est lié à des problèmes liés à l'imbrication de tels intervalles, ce qui signifie que l'intervalle de 94% peut être plus court que l'intervalle de 95%. Pour en savoir plus à ce sujet, voir la section 2.5 de mon récent article (à paraître dans Bernoulli).
Et un deuxième "non"
θ0=0
Et parfois "oui" n'est pas une bonne chose
Comme l'a souligné f coppens dans un commentaire, les intervalles et les tests ont parfois des objectifs quelque peu contradictoires. Nous voulons des intervalles courts et des tests avec une puissance élevée, mais l'intervalle le plus court ne correspond pas toujours au test avec la puissance la plus élevée. Pour quelques exemples de cela, voir cet article (distribution normale multivariée), ou ceci (distribution exponentielle), ou la section 4 de ma thèse .
Les Bayésiens peuvent aussi dire oui et non
Il y a quelques années, j'ai posé ici une question sur la question de savoir si une équivalence d'intervalle de test existe également dans les statistiques bayésiennes. La réponse courte est qu'en utilisant le test d'hypothèse bayésienne standard, la réponse est "non". En reformulant un peu le problème des tests, la réponse peut cependant être «oui». (Mes tentatives pour répondre à ma propre question se sont finalement transformées en papier !)