En effet, vous proposez d'utiliser la régression linéaire comme procédure mathématique pour condenser une observation à 10 variables en une seule variable (la pente). En tant que tel, ce n'est qu'un autre exemple de procédures similaires comme (par exemple) l'utilisation d'une moyenne de mesures répétées comme variable de régression ou l'inclusion des scores des composantes principales dans une régression.
Des commentaires spécifiques suivent.
(1) La régression linéaire n'exige pas que les X (variables indépendantes) soient "indépendants". En effet, dans la formulation standard, le concept d'indépendance ne s'applique même pas parce que les X sont des valeurs fixes, pas des réalisations d'une variable aléatoire.
(2) Oui, vous pouvez utiliser les pentes comme variables dépendantes . Cela aiderait à établir qu'elles pourraient se comporter comme la variable dépendante dans la régression linéaire. Pour les moindres carrés ordinaires, cela signifie que
une. Les pentes peuvent dépendre de certains des attributs du patient.
b. La dépendance est approximativement linéaire, au moins pour la gamme des attributs observés du patient.
c. Toute variation entre une pente observée et la pente hypothétique peut être considérée comme aléatoire.
ré. Cette variation aléatoire est (i) indépendante d'un patient à l'autre et (ii) a approximativement la même distribution d'un patient à l'autre.
e. Comme précédemment, les variables indépendantes ne sont pas considérées comme aléatoires mais comme fixes et mesurées sans erreur appréciable.
Si toutes ces conditions tiennent approximativement, vous devriez être d'accord. Les violations de (d) ou (e) peuvent être corrigées en utilisant des généralisations des moindres carrés ordinaires.
(2 '). Étant donné que les pentes présentent une incertitude (telle que mesurée dans la régression utilisée pour estimer les pentes), elles peuvent ne pas être de bons candidats pour des variables indépendantes , sauf si vous les traitez comme aléatoires dans un modèle mixte ou si vous utilisez un modèle avec erreurs dans les variables.
Vous pouvez également faire face à cette situation grâce à un modèle Bayes hiérarchique .