Affectation aléatoire: pourquoi s'embêter?

L'attribution aléatoire est précieuse car elle garantit l'indépendance du traitement par rapport aux résultats potentiels. C'est ainsi que cela conduit à des estimations non biaisées de l'effet moyen du traitement. Mais d'autres schémas d'affectation peuvent également garantir systématiquement l'indépendance du traitement par rapport aux résultats potentiels. Alors pourquoi avons-nous besoin d'une assignation aléatoire? Autrement dit, quel est l'avantage de l'assignation aléatoire par rapport aux schémas d'assignation non aléatoires qui conduisent également à une inférence non biaisée?

Soit un vecteur d'affectations de traitement dans lequel chaque élément est 0 (unité non affectée au traitement) ou 1 (unité affectée au traitement). Dans un article de JASA, Angrist, Imbens et Rubin (1996, 446-47) disent que l'affectation de traitement est aléatoire si pour tous et tels que , où est un vecteur de colonne avec tous les éléments égaux à 1. $\mathbf{Z}$ $Z_i$ $\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})$ $\mathbf{c}$ $\mathbf{c'}$ $\iota^T\mathbf{c} = \iota^T\mathbf{c'}$ $\iota$

En d'autres termes, l'affirmation est que l'affectation $Z_i$ est aléatoire si tout vecteur d'affectations qui comprend $m$ affectations au traitement est aussi probable que tout autre vecteur qui comprend $m$ affectations au traitement.

Mais, pour garantir l'indépendance des résultats potentiels de l'attribution du traitement, il suffit de s'assurer que chaque unité de l'étude a une probabilité égale d'assignation au traitement. Et cela peut facilement se produire même si la plupart des vecteurs d'attribution de traitement ont une probabilité nulle d'être sélectionnés. Autrement dit, cela peut se produire même dans le cadre d'une affectation non aléatoire.

Voici un exemple. Nous voulons exécuter une expérience avec quatre unités dans lesquelles exactement deux sont traitées. Il existe six vecteurs d'affectation possibles:

1100
1010
1001
0110
0101
0011

où le premier chiffre de chaque numéro indique si la première unité a été traitée, le deuxième chiffre indique si la deuxième unité a été traitée, etc.

Supposons que nous exécutons une expérience dans laquelle nous excluons la possibilité d'assigner les vecteurs 3 et 4, mais dans laquelle chacun des autres vecteurs a une chance égale (25%) d'être choisi. Ce schéma n'est pas une attribution aléatoire au sens AIR. Mais dans l'attente, cela conduit à une estimation non biaisée de l'effet moyen du traitement. Et ce n'est pas un hasard. Tout schéma d'attribution qui donne aux sujets une probabilité égale d'assignation au traitement permettra une estimation non biaisée de l'ETA.

Alors: pourquoi avons-nous besoin d'une affectation aléatoire au sens AIR? Mon argument est enraciné dans l'inférence de randomisation; si l'on pense plutôt en termes d'inférence basée sur un modèle, la définition d'AIR semble-t-elle plus défendable?

— user697473
source

Je n'ai pas lu Angrist et al., Alors peut-être que je manque quelque chose, mais j'ai un petit problème avec votre phrasé. Nous n'utilisons pas d'assignation aléatoire pour garantir que le traitement est indépendant des résultats potentiels. La question de savoir si le traitement est indépendant des résultats d'une véritable expérience dépend de l'existence ou non d'un lien de causalité direct entre le traitement et le résultat. Au contraire, l'assignation aléatoire garantit que le traitement est indépendant des variables cachées (ou des facteurs de confusion potentiels). C'est la possibilité que le résultat ait été causé par autre chose que le traitement que nous espérons exclure.

— gung - Rétablir Monica

@gung, je pense que vous confondez «résultats potentiels» et «résultats». Il est vrai que l'assignation aléatoire n'assure pas l'indépendance du traitement des résultats (c'est-à-dire des résultats observés). Mais les résultats potentiels ne sont pas les mêmes que les résultats observés, et l'assignation aléatoire garantit l'indépendance du traitement par rapport aux résultats potentiels. Je ne modifierai pas le message d'origine pour développer ce point; cela me mènerait trop loin du sujet principal. Mais en.wikipedia.org/wiki/Rubin_causal_model peut être utile sur ce point.

— user697473

«[Pour] garantir l'indépendance des résultats potentiels de l'attribution du traitement, il suffit de garantir que chaque unité de l'étude a une probabilité égale d'assignation au traitement.» Ceci est une erreur. Supposons que vous ayez inscrit hommes et femmes dans une étude. Lancez une pièce juste: si c'est la tête, affectez toutes les femmes au groupe de traitement (et tous les hommes au groupe de contrôle); en cas de queue, tous les mâles seront dans le groupe de traitement et toutes les femelles dans le groupe témoin. Chaque sujet (évidemment) a 50% de chances d'être assigné au groupe de traitement - mais le traitement est complètement confondu avec le sexe.

x

$x$

x

$x$

— whuber

@whuber, votre commentaire ne semble pas correct. Pour voir pourquoi, supposons = 1. Les résultats potentiels de l'homme sont Y (1) = 1 et Y (0) = 0. (C'est-à-dire = 1 si l'homme est traité, 0 sinon.) Pour la femme, les résultats potentiels sont Y (1) = -1 et Y (0) = 2. (Les résultats potentiels particuliers importent peu, mais les petits nombres entiers simplifient les choses.) Alors E [Y (1) | Z] = E [Y (1)] = 0. Des égalités similaires sont valables pour E [Y (0)]. Plus généralement, votre mécanisme d'affectation n'est pas confondu avec le sexe et il produira une estimation ATE impartiale. Si je me méprends sur quelque chose, faites-le moi savoir.

x

$x$

Y_{m}

$Y_m$

— user697473

Bien sûr, l'estimation est "non biaisée" dans le même sens qu'une horloge arrêtée donne une estimation non biaisée du temps! En fait, c'est pire que cela: cette méthode de sélection aléatoire donne des résultats qui ne peuvent pas être attribués au traitement, car ils peuvent tout aussi bien être attribués au sexe. Voilà ce que signifie confondre. Se concentrer sur l'obtention de résultats impartiaux tout en détruisant toutes les informations utiles dans l'expérience est le

— rejet

Réponses:

Cela fait suite au commentaire de Gung. L'effet global moyen du traitement n'est pas la question.

Supposons que vous ayez nouveaux cas de diabète où le sujet a entre et et nouveaux patients diabétiques de plus de . Vous souhaitez affecter la moitié au traitement. Pourquoi ne pas lancer une pièce, et sur la tête, traiter tous les jeunes patients, et sur la queue, traiter tous les patients plus âgés? Chacun aurait un $1000$ $5$ $15$ $1000$ $30$ $50\%$ chance d'être sélectionné pour le traitement, donc cela ne fausserait pas le résultat moyen du traitement, mais cela jetterait beaucoup d'informations. Il ne serait pas surprenant que le diabète juvénile ou les patients plus jeunes se révèlent beaucoup mieux ou pires que les patients plus âgés atteints de diabète de type II ou gestationnel. L'effet de traitement observé pourrait être non biaisé mais, par exemple, il aurait un écart-type beaucoup plus important que celui qui se produirait par assignation aléatoire, et malgré le grand échantillon, vous ne seriez pas en mesure de dire grand-chose. Si vous utilisez l'assignation aléatoire, alors avec une probabilité élevée, environ cas dans chaque groupe d'âge recevront le traitement, vous pourrez donc comparer le traitement sans traitement dans chaque groupe d'âge. $500$

Vous pourrez peut-être faire mieux que d'utiliser l'assignation aléatoire. Si vous remarquez un facteur qui, selon vous, pourrait influer sur la réponse au traitement, vous voudrez peut-être vous assurer que les sujets avec cet attribut sont divisés plus uniformément que ce qui se produirait lors de l'assignation aléatoire. L'affectation aléatoire vous permet de faire raisonnablement bien avec tous les facteurs simultanément, de sorte que vous pouvez analyser de nombreux modèles possibles par la suite.

— Douglas Zare
source

Merci, Douglas. Cette réponse est logique pour moi. Pour mémoire, je n'avais en tête rien d'aussi extrême que votre exemple ou l'exemple de @ whuber ci-dessus. Je pensais au lieu de cas dans lesquels nous éliminons de la considération seulement quelques vecteurs de traitement. (Prenons un cas dans lequel un client dit "vous pouvez traiter cette personne ou celle-là, mais pas les deux.")

— user697473

Je pense que si vous éliminez seulement quelques vecteurs, vous ne changez pas beaucoup la quantité d'informations que vous pouvez extraire. Quantifier cela avec précision peut être compliqué - il existe des limites naïves qui sont probablement trop pessimistes.

— Douglas Zare

@DouglasZare J'ai une question sur votre exemple extrême. Je crois que l'objectif est de déterminer si le traitement est efficace pour la population qui a des patients jeunes et vieux. Ensuite, votre méthode générera deux échantillons qui ne peuvent pas être considérés comme l'échantillon représentatif de la distribution des résultats potentiels où toutes les personnes suivent un traitement et de la distribution des résultats potentiels où toutes les personnes prennent le contrôle. Donc, votre effet de traitement observé est biaisé

F_{t}

$F_t$

F_{c}

$F_c$

— KevinKim

Dans votre exemple, vous pouvez également laisser de côté 2 et 5 et ne pas vous contredire. Au niveau d'un objet, il y a toujours une chance égale d'être 1 ou 0 quand il n'y a qu'une chance de 1: 1 de sélectionner 1 ou 6. Mais, maintenant, ce que vous avez fait en supprimant 3 et 4 devient plus évident.

— John
source

Merci, John. Oui tu as raison. Il semble que nous pouvons éliminer autant de vecteurs d'assignation de traitement que nous le souhaitons, dans n'importe quelle combinaison, tant que nous utilisons les vecteurs restants d'une manière qui donne à chaque unité une probabilité égale d'assignation au traitement.

— user697473

Je ne pense pas que vous compreniez ce que je dis. Ce que j'ai présenté est le cas ad absurdum de votre argument qui plaide contre.

— John

Votre exemple est extrême, mais je n'y vois rien d'absurde. C'est une démonstration valable du point: les schémas d'assignation non aléatoires (comme l'utilisation uniquement des vecteurs 1 et 6) peuvent conduire directement à une estimation non biaisée de l'effet moyen du traitement. Il s'ensuit que nous n'avons pas besoin d'assignation aléatoire pour obtenir des estimations ATE non biaisées. Bien sûr, il peut encore y avoir des raisons pour lesquelles il est mauvais d'éliminer les vecteurs 2 à 5. (Voir le commentaire de Douglas Zare ci-dessus .) Je n'ai pas encore réfléchi à ces raisons.

— user697473

Vous devriez. C'est pourquoi vous ne pouvez pas les éliminer.

— John

Voici une autre des variables cachées ou déroutantes: le temps (ou la dérive instrumentale, les effets du stockage des échantillons, etc.).
Il y a donc des arguments contre la randomisation (comme le dit Douglas: vous pouvez faire mieux que la randomisation). Par exemple, vous pouvez savoir à l'avance que vous souhaitez que vos cas soient équilibrés dans le temps. Tout comme vous pouvez savoir à l'avance que vous souhaitez équilibrer le sexe et l'âge.

En d'autres termes, si vous souhaitez choisir manuellement l'un de vos 6 schémas, je dirais que 1100 (ou 0011) est un mauvais choix. Notez que les premières possibilités que vous avez rejetées sont celles qui sont les plus équilibrées dans le temps ... Et les deux pires sont restés après que John ait proposé de sortir également 2 et 5 (contre lesquels vous n'avez pas protesté).
En d'autres termes, votre intuition sur les schémas qui sont "agréables" mène malheureusement à une mauvaise conception expérimentale (à mon humble avis, cela est assez courant; peut-être que les choses ordonnées sont plus belles - et il est sûr plus facile de garder une trace des séquences logiques pendant l'expérience).

Vous pouvez peut-être faire mieux avec des schémas non randomisés, mais vous pouvez également faire bien pire. À mon humble avis, vous devriez être en mesure de donner des arguments physiques / chimiques / biologiques / médicaux / ... pour le schéma non aléatoire particulier que vous utilisez, si vous optez pour un schéma non aléatoire.

— cbeleites mécontents de SX
source