Comment contrôler les différences de groupe et individuelles dans les scores avant traitement dans un essai contrôlé randomisé?


9

Andrew Gelman, dans le livre qu'il a écrit avec Jennifer Hill, déclare au chapitre 9, (section 9.3), à la page 177:

Il convient uniquement de contrôler les prédicteurs avant le traitement ou, plus généralement, les prédicteurs qui ne seraient pas affectés par le traitement (comme la race ou l'âge). Ce point sera illustré plus concrètement dans la section 9.7 ...

Et là (9.7 est intitulé "ne pas contrôler les variables post-traitement"), il discute directement du problème de la mesure des variables médiatrices, plutôt que du problème pré-post-changement.

Il est important de déclarer ici que je pense que Gelman / Hill est un texte brillant ... Et j'aime vraiment le comprendre. Cependant, cela a piqué mon intérêt, car cela me rappelle l'approche d'Everitt & Pickles au même problème.

Everitt est d'avis que l'utilisation d'un score de changement (score B - score A) aura tendance à biaiser vos résultats en faveur du traitement, alors que l'inclusion de scores de base dans le modèle est plus conservatrice. Ils soutiennent cela avec une simulation - c'est assez convaincant.

D'après ce que j'ai compris jusqu'à présent, ce que vous contrôlez, ce sont les différences de groupe dans les scores de base qui pourraient faire en sorte que l'effet apparent du traitement soit supérieur à ce qu'il est, ou qu'il existe, lorsqu'il ne l'est pas. Je crois également comprendre que cela est dû au fait que la régression vers la moyenne est à l'œuvre, de sorte que des scores de référence plus élevés seront associés à des diminutions plus importantes et vice versa, indépendamment de l'effet du traitement.

Everitt est vigoureusement contre les «scores de changement», et Gelman semble déconseiller d'inclure les scores de base dans le modèle.

Cependant, Gelman le démontre au cours des 2-3 pages suivantes, y compris les scores du pré-test comme prédicteur. Il met en garde que vous obtenez ensuite une gamme d'effets de traitement plausibles qui sont conditionnels au score du pré-test, pas une gamme d'effets de traitement représentant simplement une incertitude dans les effets.

Mon opinion est que l'utilisation des «scores de changement» ne semble pas vraiment avoir un effet sur la régression vers la moyenne, alors que l'inclusion du score de base comme prédicteur permet d' annuler les différences de groupe de base , introduisant essentiellement une structure de covariance.

Je suis médecin et je dois prendre de vraies décisions sur les traitements qui fonctionnent. Donc qu'est ce que je devrais faire? Inclure les scores de base de chaque personne ou utiliser «changer les scores»?


Bien sûr, ce que vous feriez, c'est de le modéliser dans les deux sens
rosser

Réponses:


5

{Je triche, j'ajoute un commentaire trop long pour la zone de commentaire.} Merci pour votre explication. On dirait que vous avez trouvé de bonnes sources et fait beaucoup pour en tirer de bonnes leçons. Il existe d'autres sources qui valent la peine d'être lues, par exemple un chapitre de Cook and Campbell's Quasi- Experimentation; une section dans la conception et l'analyse de Geoffrey Keppel; et je pense au moins un article de Donald Rubin. Je vais également offrir une leçon que j'ai glanée (paraphrasée) du travail de Damian Betebenner sur les résultats des tests des élèves:

Est-il raisonnable de s'attendre à ce qu'aucune amélioration ne se produise en l'absence d'une certaine intervention? Dans l'affirmative, il est logique d'analyser les scores de gain, comme pour l'analyse de la variance. Est-il plutôt raisonnable de penser que tous les élèves s'amélioreraient dans une certaine mesure même sans l'intervention, et que leur score post-test pourrait être prédit comme une fonction linéaire de leur score pré-test? Dans l'affirmative, l'analyse de la covariance aurait un sens.

de l' organigramme ANOVA / ANCOVA

Vous le savez peut-être aussi, mais Lord's Paradox, auquel Betebenner fait référence, implique la possibilité d'obtenir, avec les mêmes données, un résultat de différence moyenne nulle en utilisant l'une de ces deux méthodes mais une différence significative en utilisant l'autre.

Mon point de vue, basé sur des lectures peut-être plus limitées que les vôtres, est que les deux méthodes ont une place et que Everitt et peut-être aussi Gelman, aussi grands soient-ils, prennent dans ce cas une ligne trop dure.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.