Je suis préoccupé par le problème que j'aimerais amorcer la valeur de p pour une estimation de partir de données multipliées imputées (MI), mais qu'il n'est pas clair pour moi comment combiner les valeurs de p entre les ensembles d'IM.
Pour les ensembles de données MI, l'approche standard pour arriver à la variance totale des estimations utilise les règles de Rubin. Voir ici pour un examen de la mise en commun des ensembles de données MI. La racine carrée de la variance totale sert d'estimation d'erreur standard de . Cependant, pour certains estimateurs, la variance totale n'a pas de forme fermée connue ou la distribution d'échantillonnage n'est pas normale. La statistique θ / s e ( θ ) peut alors ne pas être distribuée t, pas même asymptotiquement.
Par conséquent, dans le cas des données complètes, une option alternative consiste à amorcer la statistique pour trouver la variance, une valeur de p et un intervalle de confiance, même si la distribution d'échantillonnage n'est pas normale et sa forme fermée inconnue. Dans le cas MI, il y a alors deux options:
- Mettre en commun la variance amorcée entre les ensembles de données MI
- Mettre en commun la valeur de p ou les limites de confiance entre les ensembles de données MI
La première option utiliserait alors à nouveau les règles de Rubin. Cependant, je pense que cela pose problème si a une distribution d'échantillonnage non normale. Dans cette situation (ou plus généralement, dans toutes les situations), la valeur de p amorcée peut être utilisée directement. Cependant, dans le cas de l'IM, cela conduirait à plusieurs valeurs de p ou intervalles de confiance, qui doivent être regroupés entre les ensembles de données de l'IM.
Ma question est donc la suivante: comment regrouper plusieurs valeurs de p (ou intervalles de confiance) amorcées sur plusieurs ensembles de données imputées?
Je serais heureux de recevoir toute suggestion sur la façon de procéder, merci.