Il est plus facile de commencer par étudier le cas où les coefficients de régression sont connus et l'hypothèse nulle donc simple. Alors la statistique suffisante est , où est le résiduel; sa distribution sous le zéro est également un chi carré mis à l'échelle par & avec des degrés de liberté égaux à la taille de l'échantillon . z σ 2 0 nT=∑z2zσ20n
Notez le rapport des probabilités sous & et confirmez que c'est une fonction croissante de pour tout : σ = σ 2 T σ 2 > σ 1σ=σ1σ=σ2Tσ2>σ1
La fonction du rapport de vraisemblance log est , et directement proportionnelle à avec un gradient positif lorsque .Tσ2>σ1
ℓ(σ2;T,n)−ℓ(σ1;T,n)=n2⋅[log(σ21σ22)+Tn⋅(1σ21−1σ22)]
Tσ2>σ1
Ainsi, selon le théorème de Karlin-Rubin, chacun des tests vs & vs est uniformément le plus puissant. Il n'y a clairement pas de test UMP de contre . Comme discuté ici , effectuer les deux tests unilatéraux et appliquer une correction de comparaisons multiples conduit au test couramment utilisé avec des régions de rejet de taille égale dans les deux queues, et c'est tout à fait raisonnable lorsque vous allez prétendre que ou que lorsque vous rejetez le null.H A : σ < σ 0 H 0 : σ = σ 0 H A : σ < σ 0 H 0 : σ = σ 0 H A : σ ≠ σ 0 σ > σ 0 σ < σ 0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ≠σ0σ>σ0σ<σ0
Trouvez ensuite le rapport des probabilités sous , l'estimation de la probabilité maximale de , & : σ σ = σ 0σ=σ^σσ=σ0
Comme , la statistique de test du rapport de vraisemblance log estσ^2=Tn
ℓ(σ^;T,n)−ℓ(σ0;T,n)=n2⋅[log(nσ20T)+Tnσ20−1]
Il s'agit d'une statistique fine pour quantifier dans quelle mesure les données prennent en charge sur . Et les intervalles de confiance formés en inversant le test du rapport de vraisemblance ont la propriété intéressante que toutes les valeurs de paramètres à l'intérieur de l'intervalle ont une probabilité plus élevée que celles à l'extérieur. La distribution asymptotique de deux fois le rapport log-vraisemblance est bien connue, mais pour un test exact, vous n'avez pas besoin d'essayer de déterminer sa distribution - utilisez simplement les probabilités de queue des valeurs correspondantes de dans chaque queue.HA:σ≠σ0H0:σ=σ0T
Si vous ne pouvez pas avoir un test uniformément le plus puissant, vous voudrez peut-être celui qui est le plus puissant contre les alternatives les plus proches de la valeur nulle. Trouvez la dérivée de la fonction log-vraisemblance par rapport à - la fonction score:σ
dℓ(σ;T,n)dσ=Tσ3−nσ
L'évaluation de son amplitude à donne un test localement le plus puissant de vs . Parce que la statistique de test est limitée ci-dessous, avec de petits échantillons, la région de rejet peut être confinée à la queue supérieure. Encore une fois, la distribution asymptotique du score au carré est bien connue, mais vous pouvez obtenir un test exact de la même manière que pour le TLR.σ0H0:σ=σ0HA:σ≠σ0
Une autre approche consiste à limiter votre attention aux tests impartiaux, à savoir ceux pour lesquels la puissance sous n'importe quelle alternative dépasse la taille. Vérifiez que votre statistique suffisante a une distribution dans la famille exponentielle; alors pour un test de taille , si ou , sinon , vous pouvez trouver le test sans biais le plus puissant en résolvant
αϕ(T)=1T<c1T>c2ϕ(T)=0
E(ϕ(T))E(Tϕ(T))=α=αET
Un graphique permet de montrer le biais dans le test des zones de queue égales et comment il se produit:
Aux valeurs de un peu plus de la probabilité accrue que les statistiques de test tombent dans le rejet de rejet de la queue supérieure ne compense pas la probabilité réduite de sa chute dans la région de rejet de la queue inférieure et la puissance de la test tombe en dessous de sa taille.σσ0
Être impartial est bon; mais il ne va pas de soi qu'avoir une puissance légèrement inférieure à la taille sur une petite région de l'espace des paramètres au sein de l'alternative est si mauvais qu'il exclut complètement un test.
Deux des tests bilatéraux ci-dessus coïncident (dans ce cas, pas en général):
Le LRT est UMP parmi les tests non biaisés. Dans les cas où cela n'est pas vrai, le TLR peut toujours être asymptotiquement impartial.
Je pense que tous, même les tests unilatéraux, sont admissibles, c'est-à-dire qu'il n'y a pas de test plus puissant ou aussi puissant sous toutes les alternatives - vous ne pouvez rendre le test plus puissant contre les alternatives dans un sens qu'en le rendant moins puissant contre les alternatives dans l'autre direction. Au fur et à mesure que la taille de l'échantillon augmente, la distribution du chi carré devient de plus en plus symétrique, et tous les tests bilatéraux finiront par être sensiblement les mêmes (une autre raison d'utiliser le test simple à queue égale).
Avec l'hypothèse nulle composite, les arguments deviennent un peu plus compliqués, mais je pense que vous pouvez obtenir pratiquement les mêmes résultats, mutatis mutandis. Notez que l'un mais pas l'autre des tests unilatéraux est UMP!