La randomisation dans un échantillon non aléatoire peut toujours montrer qu'un effet n'est pas raisonnablement expliqué par une variation aléatoire.
Par exemple, imaginez que nous avons une population avec deux sous-groupes non reconnus (avec des caractéristiques quelque peu différentes *) de taille à peu près égale, mais votre échantillon n'est pas aléatoire, ce qui donne une répartition 80/20. Imaginons 2 groupes de traitement de taille égale. La randomisation (au moins avec des tailles d'échantillon décentes) tendra à donner près de cette répartition 80/20 dans chaque groupe, de sorte que les effets du traitement sont dus au traitement, plutôt qu'à une répartition inégale des groupes hétérogènes aux traitements.
* conduisant à des références différentes, par exemple
Le problème survient lorsque vous souhaitez étendre l'inférence à une population cible autre que celle de votre échantillon (les auto-sélecteurs); cela nécessite des hypothèses / un argument pour lequel vous ne disposez d'aucune preuve (comme supposer que les différences de traitement seront cohérentes pour tous les sous-ensembles de la population).
Pour une situation similaire, imaginez tester un médicament contre l'hypertension uniquement sur des hommes, par rapport à un traitement standard et un placebo. Supposons que les hommes sont correctement randomisés dans le groupe de traitement. Un effet de traitement sera réel dans le sens où il décrit vraiment un effet chez l'homme. La difficulté viendra lorsque l'on tentera d'étendre cette inférence aux femmes .
Donc, s'ils sont correctement menés et randomisés en dehors du recrutement, un effet significatif observé sera ce qu'il semble, mais il s'appliquera à ce que vous avez réellement échantillonné, pas nécessairement à ce que votre objectif souhaité était - le franchissement de l'écart entre les deux peut exiger un argument prudent; un tel argument est souvent absent.
Quand j'étais étudiant, il était assez courant que des expériences de psychologie soient menées sur des étudiants en psychologie, qui devaient se porter volontaires pour un certain nombre d'heures de telles expériences (cela peut toujours être le cas mais je n'ai pas de contact régulier avec les psychologues). qui font des expériences). Avec la randomisation au traitement, les inférences peuvent avoir été valides (selon ce qui a été fait) mais s'appliqueraient à la population locale des étudiants de premier cycle en psychologie autosélectionnés (en ce qu'ils choisissent généralement les expériences auxquelles s'inscrire), qui sont très loin de un échantillon aléatoire de l'ensemble de la population.