D'une manière générale (pas seulement pour la qualité des tests d'ajustement, mais dans de nombreuses autres situations), vous ne pouvez tout simplement pas conclure que la valeur nulle est vraie, car il existe des alternatives qui ne peuvent pas être distinguées de la valeur nulle à n'importe quelle taille d'échantillon.
Voici deux distributions, une normale standard (ligne continue verte) et une apparence similaire (90% normale normale et 10% bêta standardisée (2,2), marquées d'un trait pointillé rouge):
Le rouge n'est pas normal. Par exemple, , nous avons peu de chances de repérer la différence, nous ne pouvons donc pas affirmer que les données sont tirées d'une distribution normale - et si c'était à partir d'une distribution non normale comme la rouge à la place?n=100
De plus petites fractions de bêta normalisées avec des paramètres égaux mais plus grands seraient beaucoup plus difficiles à voir comme différentes d'une normale.
Mais étant donné que les données réelles sont presque jamais d' une certaine distribution simple, si nous avions un oracle parfait (ou efficacement infinies taille des échantillons), nous essentiellement toujours rejeter l'hypothèse que les données étaient d' une certaine forme distributive simple.
Comme l'a dit George Box , " Tous les modèles sont faux, mais certains sont utiles. "
Pensez, par exemple, à tester la normalité. Il se peut que les données proviennent en fait de quelque chose de proche de la normale, mais seront-elles jamais exactement normales? Ils ne le sont probablement jamais.
Au lieu de cela, le mieux que vous puissiez espérer avec cette forme de test est la situation que vous décrivez. (Voir, par exemple, l'article Les tests de normalité sont-ils essentiellement inutiles?, Mais il y a un certain nombre d'autres articles ici qui soulèvent des points connexes)
F
Considérez à nouveau l'image ci-dessus. La distribution rouge n'est pas normale, et avec un échantillon vraiment grand, nous pourrions rejeter un test de normalité basé sur un échantillon de celui-ci ... mais à une taille d'échantillon beaucoup plus petite, des régressions et deux échantillons t-tests (et de nombreux autres tests en outre) se comportera si bien qu’il sera inutile de s’inquiéter même un peu de cette non-normalité.
μ=μ0
Vous pourriez être en mesure de spécifier certaines formes particulières de déviation et de regarder quelque chose comme le test d'équivalence, mais c'est un peu délicat avec l'ajustement car il y a tellement de façons pour une distribution d'être proche mais différente d'une hypothétique, et différente les formes de différence peuvent avoir des impacts différents sur l'analyse. Si l'alternative est une famille plus large qui inclut le nul comme cas spécial, le test d'équivalence a plus de sens (test exponentiel par rapport au gamma, par exemple) - et en effet, l'approche du "test bilatéral" est appliquée, et cela pourrait être un moyen de formaliser "assez près" (ou ce serait le cas si le modèle gamma était vrai, mais en fait, il serait lui-même pratiquement certain d'être rejeté par un test ordinaire de qualité de l'ajustement,
La qualité des tests d'ajustement (et souvent plus largement, les tests d'hypothèse) ne convient vraiment qu'à un éventail assez limité de situations. La question à laquelle les gens veulent habituellement répondre n'est pas si précise, mais un peu plus vague et plus difficile à répondre - mais comme l'a dit John Tukey, "Il vaut mieux une réponse approximative à la bonne question, qui est souvent vague, qu'une réponse exacte à la mauvaise question, qui peut toujours être précise. "
Des approches raisonnables pour répondre à la question la plus vague peuvent inclure des enquêtes de simulation et de rééchantillonnage pour évaluer la sensibilité de l'analyse souhaitée à l'hypothèse que vous envisagez, par rapport à d'autres situations qui sont également raisonnablement cohérentes avec les données disponibles.
ε