J'ai écrit un programme qui génère des données aléatoires. Si le programme fonctionne correctement, ces données doivent suivre une distribution de probabilité connue et spécifique. Je voudrais exécuter le programme, faire des calculs sur le résultat et trouver une valeur p.
Avant que quelqu'un d'autre ne le dise: je comprends que les tests d'hypothèse ne peuvent pas détecter quand le programme fonctionne correctement. Il ne peut détecter que lorsqu'il fonctionne incorrectement d'une manière spécifique. (Et même dans ce cas, le test "devrait" échouer X% du temps, selon le niveau de signification que vous choisissez ...)
Donc, j'essaie de comprendre quels outils pourraient être appropriés. En particulier:
Je peux générer autant de données aléatoires que je le souhaite. Tout ce que j'ai à faire est de laisser le programme fonctionner assez longtemps. Je ne suis donc pas limité à une taille d'échantillon spécifique.
Je m'intéresse aux techniques qui produisent une valeur de p. Donc, regarder un graphique et dire "oui, ça a l'air un peu linéaire" n'est pas une option intéressante. A moins qu'il n'y ait un moyen de mettre un nombre dur sur la "wonkyness" d'un graphique. ;-)
Ce que je sais jusqu'à présent:
J'ai vu trois types principaux de tests mentionnés qui semblent pouvoir s'appliquer: le test du chi carré [Pearson], le test de Kolmogorov-Smirnov et le test d'Anderson-Darling.
Il semble qu'un test du chi carré soit approprié pour les distributions discrètes , tandis que les deux autres sont plus appropriés pour les distributions continues . (?)
Diverses sources suggèrent que le test AD est "meilleur" que le test KS, mais ne parviennent pas à entrer dans les détails.
En fin de compte, tous ces tests détectent vraisemblablement "différentes manières" de s'écarter de la distribution nulle spécifiée. Mais je ne sais pas encore vraiment quelles sont les différences ... En résumé, je cherche une sorte de description générale de l'endroit où chaque type de test est le plus applicable, et quels types de problèmes il détecte le mieux.