Contexte
Je conçois une simulation Monte Carlo qui combine les sorties de séries de modèles, et je veux être sûr que la simulation me permettra de faire des affirmations raisonnables sur la probabilité du résultat simulé et la précision de cette estimation de probabilité.
La simulation trouvera la probabilité qu'un jury issu d'une communauté spécifiée condamne un certain accusé. Ce sont les étapes de la simulation:
En utilisant les données existantes, générez un modèle de probabilité logistique ( M ) en régressant le «premier vote du juré» sur les prédicteurs démographiques.
Utilisez les méthodes de Monte Carlo pour simuler 1 000 versions de M (c'est-à-dire 1 000 versions des coefficients pour les paramètres du modèle).
Sélectionnez l'une des 1 000 versions du modèle ( M i ).
Empanel 1 000 jurys en sélectionnant au hasard 1 000 ensembles de 12 «jurés» dans une «communauté» ( C ) d'individus avec des distributions de caractéristiques démographiques spécifiques.
Calculer de manière déterministe la probabilité d'un premier tour de scrutin coupable pour chaque juré à l'aide de M i .
Rendez le vote probable de chaque «juré» en un vote déterminé (selon qu'il est supérieur ou inférieur à la valeur choisie au hasard entre 0 et 1).
Déterminez le «vote final» de chaque «jury» en utilisant un modèle (dérivé de données empiriques) de la probabilité qu'un jury condamne, sous réserve de la proportion de jurés votant pour une condamnation au premier tour.
Enregistrez la proportion de verdicts de culpabilité pour les 1000 jurys ( PG i ).
Répétez les étapes 3-8 pour chacune des 1000 versions simulées de M .
Calculer la valeur moyenne du PG et du rapport que l'estimation ponctuelle de la probabilité de condamnation en C .
Identifiez les valeurs des percentiles 2,5 et 97,5 pour PG et signalez-les comme un intervalle de confiance de 0,95.
J'utilise actuellement 1 000 jurés et 1 000 jurys selon la théorie selon laquelle 1 000 tirages aléatoires à partir d'une distribution de probabilité - les caractéristiques démographiques de C ou des versions de M - rempliront cette distribution.
Des questions
Est-ce que cela me permettra de déterminer avec précision la précision de mon estimation? Si oui, combien de jurys dois-je empaneler pour chaque calcul PG i pour couvrir la distribution de probabilité de C (donc j'évite le biais de sélection); puis-je utiliser moins de 1 000?
Merci beaucoup pour toute aide!