Un exemple pourrait aider à illustrer. Supposons que , dans un cadre de modélisation de cause à effet, vous êtes intéressé à déterminer si la relation entre (une exposition d'intérêt) un Y (un résultat d'intérêt) est médiée par une variable W . Cela signifie que dans les deux modèles de régression:XYW
E[Y|X]E[Y|X,W]==β0+β1Xγ0+γ1X+γ2W
L'effet est différent de l'effet γ 1 .β1γ1
À titre d'exemple, considérons la relation entre le tabagisme et le risque cardiovasculaire (CV). Le tabagisme augmente évidemment le risque CV (pour des événements comme les crises cardiaques et les accidents vasculaires cérébraux) en provoquant la fragilisation et la calcification des veines. Cependant, le tabagisme est également un coupe-faim. Nous serions donc curieux de savoir si la relation estimée entre le tabagisme et le risque CV est médiée par l'IMC, qui est indépendamment un facteur de risque de risque CV. Ici, pourrait être un événement binaire (infarctus du myocarde ou neurologique) dans un modèle de régression logistique ou une variable continue comme la calcification artérielle coronaire (CAC), la fraction d'éjection ventriculaire gauche (FEVG) ou la masse ventriculaire gauche (LVM).Y
Nous adapterions deux modèles 1: ajustement pour le tabagisme et le résultat avec d'autres facteurs de confusion comme l'âge, le sexe, le revenu et les antécédents familiaux de maladie cardiaque, puis 2: toutes les covariables précédentes ainsi que l'indice de masse corporelle. La différence dans l'effet de tabagisme entre les modèles 1 et 2 est l'endroit où nous basons notre inférence.
HK::β1=γ1β1≠γ1
T= β1- γ1S= β1/ γ1ou n'importe quel nombre de mesures. Vous pouvez utiliser les estimateurs habituels pourT et S. L'erreur standard de ces estimateurs est très compliquée à dériver. L'amorçage de leur distribution, cependant, est une technique couramment appliquée, et il est facile de calculer lep-valeur directement à partir de cela.