Tout d'abord, il existe de très nombreux types de simulation différents en statistique, et encore plus dans les domaines environnants. Dire simplement "Simulation" est à peu près aussi utile que dire "Modèle" - c'est-à-dire pas grand-chose du tout.
Sur la base du reste de votre question, je suppose que vous parlez de simulation de Monte Carlo, mais même cela est un peu vague. Fondamentalement, ce qui se passe, c'est que vous tirez à plusieurs reprises des échantillons d' une distribution (ce n'est pas nécessairement normal) afin de faire une analyse statistique sur une population artificielle avec des propriétés connues, mais aléatoires.
Le but de ceci a tendance à se diviser en deux catégories:
Ma méthode peut-elle gérer X? : Essentiellement, vous simulez une série de nombreuses populations aléatoires avec une «bonne» réponse connue pour voir si votre nouvelle technique vous donne la bonne réponse. Comme exemple de base, disons que vous avez développé ce que vous pensez être une nouvelle façon de mesurer la corrélation entre deux variables, X et Y. Vous simulez deux variables où la valeur de Y dépend de la valeur de X, avec du bruit aléatoire. Par exemple, Y = 0,25x + bruit. Vous créeriez ensuite une population avec des valeurs aléatoires de X, des valeurs de Y qui étaient 0,25x + un nombre aléatoire, probablement plusieurs milliers de fois, puis vous montreriez qu'en moyenne, votre nouvelle technique crache un nombre qui montre correctement que Y = 0,25x.
Ce qui se passe si? La simulation peut être effectuée comme une analyse de sensibilité pour une étude existante. Disons par exemple que j'ai mené une étude de cohorte, mais je sais que ma mesure d'exposition n'est pas très bonne. Il classe incorrectement 30% de mes sujets comme exposés alors qu'ils ne devraient pas l'être, et classe 10% de mes sujets comme non exposés alors qu'ils ne devraient pas l'être. Le problème est que je n'ai pas de meilleur test, donc je ne sais pas lequel est lequel.
Je prendrais ma population et donnerais à chaque sujet exposé 30% de chances de passer à non exposé, et chaque sujet non exposé 10% de chances de passer à exposé. Je créerais ensuite des milliers de nouvelles populations, déterminerais au hasard quels sujets changeraient et relancerais mon analyse. La gamme de ces résultats me donnera une bonne estimation de la façon dont mon résultat d'étude pourrait changer si j'aurais pu classer correctement tout le monde.
Il y a bien sûr, comme toujours, une plus grande complexité, nuance et utilité à la simulation, selon la quantité que vous voulez creuser.