L'attribution aléatoire est précieuse car elle garantit l'indépendance du traitement par rapport aux résultats potentiels. C'est ainsi que cela conduit à des estimations non biaisées de l'effet moyen du traitement. Mais d'autres schémas d'affectation peuvent également garantir systématiquement l'indépendance du traitement par rapport aux résultats potentiels. Alors pourquoi avons-nous besoin d'une assignation aléatoire? Autrement dit, quel est l'avantage de l'assignation aléatoire par rapport aux schémas d'assignation non aléatoires qui conduisent également à une inférence non biaisée?
Soit un vecteur d'affectations de traitement dans lequel chaque élément est 0 (unité non affectée au traitement) ou 1 (unité affectée au traitement). Dans un article de JASA, Angrist, Imbens et Rubin (1996, 446-47) disent que l'affectation de traitement est aléatoire si pour tous \ mathbf {c} et \ mathbf {c'} tels que \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , où \ iota est un vecteur de colonne avec tous les éléments égaux à 1.c ′ ι T c = ι T c ′ ι
En d'autres termes, l'affirmation est que l'affectation est aléatoire si tout vecteur d'affectations qui comprend affectations au traitement est aussi probable que tout autre vecteur qui comprend affectations au traitement.
Mais, pour garantir l'indépendance des résultats potentiels de l'attribution du traitement, il suffit de s'assurer que chaque unité de l'étude a une probabilité égale d'assignation au traitement. Et cela peut facilement se produire même si la plupart des vecteurs d'attribution de traitement ont une probabilité nulle d'être sélectionnés. Autrement dit, cela peut se produire même dans le cadre d'une affectation non aléatoire.
Voici un exemple. Nous voulons exécuter une expérience avec quatre unités dans lesquelles exactement deux sont traitées. Il existe six vecteurs d'affectation possibles:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
où le premier chiffre de chaque numéro indique si la première unité a été traitée, le deuxième chiffre indique si la deuxième unité a été traitée, etc.
Supposons que nous exécutons une expérience dans laquelle nous excluons la possibilité d'assigner les vecteurs 3 et 4, mais dans laquelle chacun des autres vecteurs a une chance égale (25%) d'être choisi. Ce schéma n'est pas une attribution aléatoire au sens AIR. Mais dans l'attente, cela conduit à une estimation non biaisée de l'effet moyen du traitement. Et ce n'est pas un hasard. Tout schéma d'attribution qui donne aux sujets une probabilité égale d'assignation au traitement permettra une estimation non biaisée de l'ETA.
Alors: pourquoi avons-nous besoin d'une affectation aléatoire au sens AIR? Mon argument est enraciné dans l'inférence de randomisation; si l'on pense plutôt en termes d'inférence basée sur un modèle, la définition d'AIR semble-t-elle plus défendable?