Pourquoi devons-nous avoir une hypothèse alternative?
Dans un test d'hypothèse classique, le seul rôle mathématique joué par l'hypothèse alternative est qu'elle affecte l'ordre des preuves à travers la statistique de test choisie. L'hypothèse alternative est utilisée pour déterminer la statistique de test appropriée pour le test, ce qui équivaut à établir un classement ordinal de tous les résultats de données possibles de ceux les plus propices à l'hypothèse nulle (par rapport à l'alternative indiquée) à ceux les moins propices aux hypothèses nulles (contre l'alternative indiquée). Une fois que vous avez formé ce classement ordinal des résultats de données possibles, l'hypothèse alternative ne joue plus de rôle mathématique dans le test .
Explication formelle: En tout test d'hypothèse classique avec n valeurs de données observables x=(x1,...,xn) vous avez une statistique de test T:Rn→Rqui cartographie tous les résultats possibles des données sur une échelle ordinale qui mesure si elle est plus propice à l'hypothèse nulle ou alternative. (Sans perte de généralité, nous supposerons que des valeurs plus faibles sont plus propices à l'hypothèse nulle et des valeurs plus élevées sont plus propices à l'hypothèse alternative. Nous disons parfois que des valeurs plus élevées de la statistique de test sont "plus extrêmes" dans la mesure où elles constituent plus extrêmes preuve de l'hypothèse alternative.) La valeur de p du test est alors donnée par:
p(x)≡pT(x)≡P(T(X)⩾T(x)|H0).
Cette fonction de valeur p détermine entièrement les preuves du test pour tout vecteur de données. Lorsqu'il est combiné avec un niveau de signification choisi, il détermine le résultat du test pour tout vecteur de données. (Nous l'avons décrit pour un nombre fixe de points de données n mais cela peut facilement être étendu pour permettre un arbitraire n .) Il est important de noter que la valeur de p n'est affectée par la statistique de test que par l'échelle ordinale qu'elle induit, donc si vous appliquez une transformation augmentant de façon monotone aux statistiques de test, cela ne fait aucune différence pour le test d'hypothèse (c'est-à-dire qu'il s'agit du même test). Cette propriété mathématique ne fait que refléter le fait que le seul but de la statistique de test est d'induire une échelle ordinale sur l'espace de tous les vecteurs de données possibles, pour montrer lesquels sont plus propices à la valeur nulle / alternative.
L'hypothèse alternative n'affecte cette mesure que par la fonction T , qui est choisie en fonction des hypothèses nulles et alternatives énoncées dans le modèle global. On peut donc considérer la fonction statistique de test comme une fonction T≡g(M,H0,HA) du modèle global M et des deux hypothèses. Par exemple, pour un test de rapport de vraisemblance, la statistique de test est formée en prenant un rapport (ou logarithme d'un rapport) de supremums de la fonction de vraisemblance sur des plages de paramètres relatives aux hypothèses nulles et alternatives.
Qu'est-ce que cela signifie si nous comparons des tests avec différentes alternatives? Supposons que vous avez un modèle fixe M et que vous voulez faire deux tests d'hypothèses différentes comparant la même hypothèse nulle H0 contre deux alternatives différentes HA et H′A . Dans ce cas, vous aurez deux fonctions statistiques de test différentes:
T=g(M,H0,HA)T′=g(M,H0,H′A),
conduisant aux fonctions de valeur p correspondantes:
p(x)=P(T(X)⩾T(x)|H0)p′(x)=P(T′(X)⩾T′(x)|H0).
Il est important de noter que si T et T′ sont des transformations monotones croissantes l'une de l'autre, alors les fonctions de valeur p et p′ sont identiques, donc les deux tests sont le même test. Si les fonctions T et T′ ne sont pas des transformations croissantes monotones l'une de l'autre, alors nous avons deux tests d'hypothèse vraiment différents.