Comment représenter correctement les variables de différence dans les DAG?


8

Si je suis intéressé par les effets causals du changement d'une variable ( ) sur certains résultats ( ), comment pourrais-je représenter cela dans un graphique acyclique dirigé (DAG)?EO

Supposons que , où et se produisent aux moments 1 et 2, un DAG correct serait-il: ΔE2=E2-E1E1E2

1. En supposant que est simplement capturé par tous les niveaux de et (de la même manière que les effets d'interaction sont ainsi capturés)? ΔE2E1E2



2. En supposant que est une variable causalement distincte de et , mais nécessitant la présence de ces variables? ΔE2E1E2



3. En supposant que est indépendant de & et que ces derniers ne sont pas nécessaires pour représenter les effets de ? ΔE2E1E2ΔE2


  1. Autre chose?

REMARQUE: « DAG » ne signifie pas «n'importe quel ancien type de graphique causal ou corrélationnel», mais est un formalisme étroitement interdit représentant les croyances causales.


Ma motivation est que j'essaie de penser à la représentation DAG de modèles dynamiques comme le modèle de correction d'erreur généralisé:

ΔOt=β0+βc(Ot1Et1)+βΔEΔEt+βEEt1+εt

Bien sûr, l'estimation brute des paramètres est transformée pour interpréter le modèle comme ci-dessous, alors peut-être que DAGER le modèle ci-dessus serait encore plus compliqué?

Effet instantané à court terme du changement de sur :EΔOβΔE

Effet décalé à court terme du niveau sur :EΔOβEβcβΔE

Effet d'équilibre à long terme de retardé sur :EΔOβcβEβc

Réponses:


4

La solution est de penser fonctionnellement.

La valeur de ΔE2=f(E1,E2) plus précisementΔE2=E2E1. Par conséquent, les variables de différence peuvent être représentées dans les DAG par l'option 4, "autre chose" (ce DAG supposeE1 et E2 provoquer directement O en plus de leur différence):

Si E1 & E2 n'ont pas d'effets directs sur O, ΔE2 reste toujours une fonction de ses parents:

Si nous réécrivons ainsi le modèle de correction d'erreur généralisé à un seul décalage (Qt1 pour «terme eQuilibrium», où Qt1=Ot1Et1):

ΔOt=β0+βc(Qt1)+βΔEΔEt+βEEt1+εt

Ensuite, le DAG sous-jacent au modèle pour ΔOt (en ignorant ses descendants à t+1) est:

Les effets de E sur ΔOt du modèle entrent donc du terme d'équilibre Qt1, de Et1 et de changer le terme ΔEt. Autres causes deOt1, Ot, Et1 et Et (par exemple, variables non modélisées, entrées aléatoires) sont laissées implicites.

La partie de cette réponse correspondant aux deux premiers DAG est une courtoisie de communication personnelle avec Miguel Hernán.


1

ÉDITER:

Si vous souhaitez uniquement représenter des relations non paramétriques entre vos variables, je pense que 1) serait le plus approprié. Bien qu'il puisse exister une forme fonctionnelle plus spécifique reliant les deux variables au résultat, dans un DAG, il n'est pas nécessaire de représenter cette forme. D'un autre côté, si vous vouliez utiliser un diagramme de chemin représentant un modèle d'équation structurelle linéaire comme celui que vous avez écrit, il serait logique d'inclure le score de différence dans le diagramme; de cette façon, le modèle spécifique que vous avez écrit et le diagramme seraient tout aussi spécifiques. Un DAG est plus vague (mais aussi plus flexible) car il ne nécessite pas (ou ne permet pas nécessairement) une forme de fonction spécifique.

Cela pourrait se résumer à l'objectif de dessiner votre DAG. Si votre objectif est de représenter avec autant de précision que possible les relations entre vos variables, il serait logique d'inclure le terme de différence comme sa propre variable car il a sa propre force causale. Un graphique sans lui serait également valide. Vous pourriez, en théorie, faire les mêmes déclarations d'indépendance conditionnelle sur le résultat et les prédicteurs avec un DAG plus détaillé qu'avec un DAG moins détaillé.


Mon intuition est la plus proche de 3). S'il est vrai queE1 et E2 n'affectent pas directement O sauf par leur différence, alors 3) est correct, et j'ajouterais des bords de E1 et E2 à ΔE2 et de E1 à E2pour être complet. Aucun autre nœud ne pointerait vers la variable de différence, mais les variables qui prédisent la différence pointeraient plutôt versE1 et / ou E2. Graphiquement, ce que je décris est:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

avec d'éventuelles flèches supplémentaires de E1 et E2 à O si elles affectent O au-delà de leur effet par leur différence.


"S'il est vrai que E1 et E2 n'affectent pas directement O sauf par leur différence", vous semblez ignorer le modèle que j'ai spécifié.
Alexis

Deuxième préoccupation. La variable d'interactionE1×E2 est purement fonction de E1 et E2Cependant, une telle variable ne serait pas représentée comme vous avez dessiné le DAG dans votre réponse , il est donc pas du tout clair pour moi que même si j'étais intéressé par le modèleΔO=β0+ΔE2+εque votre DAG serait correct.
Alexis

Ce sont de bonnes préoccupations. J'ignorais le modèle que vous aviez spécifié et je me concentrais sur votre question. Souhaitez-vous spécifier un diagramme de chemin représentant un modèle d'équation structurelle linéaire ou un DAG non paramétrique? Si le premier, vous voudrez inclure le terme de différence comme sa propre variable. Sinon, comme vous l'avez mentionné, il serait approprié de ne pas le faire (tout comme ce serait le cas avec une interaction). Je vais réviser ma réponse.
Noah

La question n'a rien à voir avec les SEM. Vous pouvez le dire car SEM n'apparaît pas dans la question, même sous forme de balise. :) D'un autre côté, ma question concerne les DAG. :) Aussi: concernant mon deuxième commentaire "pas du tout clair" ne signifie pas que vous n'êtes pas correct ... signifie simplement que j'ai besoin de me persuader des formalismes DAG.
Alexis

1
Ma réponse n'est probablement pas très convaincante, mais j'espère que quelqu'un d'autre pourra faire un meilleur travail. Le modèle que vous avez écrit est un SEM linéaire, donc bien que vous n'ayez pas posé de question spécifique à ce sujet, si vous essayez de relier une sorte de diagramme de chemin aux termes d'un modèle, vous vous aventurez dans le territoire du diagramme de chemin SEM.
Noah
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.