Les pentes des régressions linéaires peuvent-elles être utilisées comme variables indépendantes ou dépendantes dans d'autres modèles de régression?


8

J'ai 100 patients et chaque patient a 10 mesures longitudinales de la créatinine sérique. Les taux de filtration glomérulaire estimés (DFGe) ont été calculés à partir d'une formule MDRD comprenant le sexe, l'âge et la créatinine sérique. Le DFGe est la variable dépendante et le temps est la variable indépendante en régression linéaire pour chaque patient.

  1. Les régressions linéaires violent-elles l'hypothèse des «X indépendants» et des modèles mixtes linéaires devraient-ils être utilisés à la place?
  2. Les pentes du DFGe (qui sont des estimations avec des incertitudes plutôt que des nombres mesurés) estimées à partir de chaque patient (en régressions linéaires pour chaque patient ou dans des modèles mixtes à effets aléatoires [comment estimer les pentes pour chaque patient individuel dans des modèles mixtes?]) Peuvent être utilisées comme variables indépendantes ou dépendantes dans d'autres modèles de régression?

Je vous remercie.


Si les X (variables indépendantes) sont des variables mesurées, il s'agit alors d'une "variable aléatoire" au lieu d'une "valeur fixe". Selon Wikipedia ( en.wikipedia.org/wiki/Random_variable ): "Dans les probabilités et les statistiques, une variable aléatoire ou variable stochastique est, grosso modo, une variable dont la valeur résulte d'une mesure sur un certain type de processus aléatoire." Ai-je raison?

Veuillez ne pas utiliser de réponses pour poser des questions. Vous pouvez continuer cette conversation dans les commentaires. Une autre option consiste à republier cela sous forme de question et à créer un lien ici.
whuber

Réponses:


5

En effet, vous proposez d'utiliser la régression linéaire comme procédure mathématique pour condenser une observation à 10 variables en une seule variable (la pente). En tant que tel, ce n'est qu'un autre exemple de procédures similaires comme (par exemple) l'utilisation d'une moyenne de mesures répétées comme variable de régression ou l'inclusion des scores des composantes principales dans une régression.

Des commentaires spécifiques suivent.

(1) La régression linéaire n'exige pas que les X (variables indépendantes) soient "indépendants". En effet, dans la formulation standard, le concept d'indépendance ne s'applique même pas parce que les X sont des valeurs fixes, pas des réalisations d'une variable aléatoire.

(2) Oui, vous pouvez utiliser les pentes comme variables dépendantes . Cela aiderait à établir qu'elles pourraient se comporter comme la variable dépendante dans la régression linéaire. Pour les moindres carrés ordinaires, cela signifie que

une. Les pentes peuvent dépendre de certains des attributs du patient.

b. La dépendance est approximativement linéaire, au moins pour la gamme des attributs observés du patient.

c. Toute variation entre une pente observée et la pente hypothétique peut être considérée comme aléatoire.

ré. Cette variation aléatoire est (i) indépendante d'un patient à l'autre et (ii) a approximativement la même distribution d'un patient à l'autre.

e. Comme précédemment, les variables indépendantes ne sont pas considérées comme aléatoires mais comme fixes et mesurées sans erreur appréciable.

Si toutes ces conditions tiennent approximativement, vous devriez être d'accord. Les violations de (d) ou (e) peuvent être corrigées en utilisant des généralisations des moindres carrés ordinaires.

(2 '). Étant donné que les pentes présentent une incertitude (telle que mesurée dans la régression utilisée pour estimer les pentes), elles peuvent ne pas être de bons candidats pour des variables indépendantes , sauf si vous les traitez comme aléatoires dans un modèle mixte ou si vous utilisez un modèle avec erreurs dans les variables.

Vous pouvez également faire face à cette situation grâce à un modèle Bayes hiérarchique .


Je suis désolé pour le terme impropre de "X indépendants". Ce que je voulais dire, c'était "des Y indépendants conditionnés aux X". À savoir, les résidus doivent être indépendants. Cette hypothèse est violée dans les observations longitudinales. Référence: Modélisation des données longitudinales, II: modèles de régression standard et extensions. Méthodes Mol Biol. 2009; 473: 61-94.
Jinn-Yuh Guh

Vous pouvez en savoir plus sur les «généralisations des moindres carrés» mentionnées ci-dessus dans Lewis et Linzer 2005
conjugateprior
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.