Nous avons quelques données multivariées , tirées d'une distribution avec un paramètre inconnu . Notez que sont des exemples de résultats.D θ xxDθx
Nous voulons tester une hypothèse sur un paramètre inconnu , les valeurs de sous l'hypothèse nulle sont dans l'ensemble .θ θ 0θθθ0
Dans l'espace du , on peut définir une région de rejet , et la puissance de cette région est alors définie comme . Donc, la puissance est calculée pour une valeur particulière de comme la probabilité que le résultat de l'échantillon soit dans la région de rejet lorsque la valeur de est . Évidemment, la puissance dépend de la région et de la choisie .R R P R ˉ θ = P ˉ θ ( x ∈ R ) ˉ θ θ x R θ ˉ θ R ˉ θXRRPRθ¯= Pθ¯( x ∈ R )θ¯θXR θθ¯Rθ¯
La définition 1 définit la taille de la régionR comme le supremum de toutes les valeurs de pour dans , donc uniquement pour les valeurs de sous . Il est évident que cela dépend de la région, donc . ˉ θ θ 0 ˉ θ H 0 α R = s u p ˉ θ ∈ θ 0 P R ˉ θPRθ¯θ¯θ0θ¯H0αR=supθ¯∈θ0PRθ¯
Comme dépend de nous avons une autre valeur lorsque la région change, et ceci est la base pour définir la valeur p: changez la région, mais de telle manière que la valeur observée de l'échantillon appartient toujours à la région, pour chacune de ces régions, calculer le tel que défini ci - dessus et de prendre la borne inférieure: . La valeur de p est donc la plus petite taille de toutes les régions contenant . R α R p v ( x ) = i n f R | x ∈ R α R xαRRαRpv(x)=infR|x∈RαRx
Le théorème n'est alors qu'une «traduction» de celui-ci, à savoir le cas où les régions sont définies à l'aide d'une statistique et pour une valeur vous définissez une région comme . Si vous utilisez ce type de région dans le raisonnement ci-dessus, le théorème suit.T c R R = { x | T ( x ) ≥ c } RRTcRR={x|T(x)≥c}R
MODIFIER en raison des commentaires:
@ user8: pour le théorème; si vous définissez des régions de rejet comme dans le théorème, alors une région de rejet de taille est un ensemble qui ressemble à pour certains .R α = { X | T ( X ) ≥ c α } c ααRα={X|T(X)≥cα}cα
Pour trouver la valeur de p d'une valeur observée , c'est-à-dire vous devez trouver la plus petite région , c'est-à-dire la plus grande valeur de telle que contient toujours , ce dernier (la région contient ) équivaut (en raison de la façon dont les régions sont définies) à dire que , donc vous devez trouver le plus grand tel quep v ( x ) R c { X | T ( X ) ≥ c } x x c ≥ T ( x ) c { X | T ( X ) ≥ c & c ≥ T ( x ) }xpv(x)Rc{X|T(X)≥c} xxc≥T(x)c{X|T(X)≥c&c≥T(x)}
De toute évidence, le plus grand tel que devrait être , puis l'ensemble ci-dessus devientc ≥ T ( x ) c = T ( x ) { X | T ( X ) ≥ c = T ( x ) } = { X | T ( X ) ≥ T ( x ) }cc≥T(x)c=T(x){X|T(X)≥c=T(x)}={X|T(X)≥T(x)}