J'ai trouvé de nombreux articles utiles sur les variables indépendantes standardisées et les variables indépendantes centrées sur stats.stackexchange.com, mais je suis toujours un peu confus. Je vous demande une évaluation de ce que j'ai compris. De plus, si ce qui suit n'est pas correct, pourriez-vous me corriger?
- Comment normaliser. Les variables standardisées sont obtenues en soustrayant la moyenne de la variable et en divisant par l'écart-type de cette même variable.
- Comment centrer. Les variables indépendantes centrées sont obtenues simplement en soustrayant la moyenne de la variable.
- La raison de la normalisation. Vous standardisez les variables pour faciliter l'interprétation des coefficients estimés lorsque les variables de votre régression ont différentes unités de mesure. Lorsque vous souhaitez standardiser, vous devez standardiser toutes les variables de la régression - ce qui implique que vous n'obtiendrez pas d'estimation de la constante (c'est-à-dire le B0 ou l'interception).
- La raison du centrage. Vous centrez les variables si vous souhaitez obtenir une interprétation significative de la constante estimée. Dans ce cas, vous pouvez centrer le nombre de variables que vous souhaitez; vous n'avez pas besoin de centrer toutes les variables indépendantes dans le modèle.
- La variable indépendante, Y. (question simple) Avez-vous déjà centré ou normalisé le Y?
- Utilisation du logarithme naturel. Si une ou plusieurs de vos variables ne sont pas normalement distribuées, vous pouvez les transformer en utilisant le logarithme népérien. Seulement APRÈS cette transformation, vous pouvez soit standardiser toutes les variables, soit centrer celles que vous devez centrer. En général, quelle que soit la transformation d'une variable qui doit se produire avant la standardisation ou le centrage (ici je parle de logarithme naturel, mais vous pouvez quadriller une variable ou diviser une variable par une autre, par exemple, population / km2)
- Coefficients d'interprétation variables standardisées. "Une augmentation de 1 écart-type de X1 augmentera (ou diminuera) Y de -nombre-."
- Variables centrées sur les coefficients d'interprétation. Coefficients de variables aléatoires: "Une augmentation de X1 de -nombre- par rapport à sa moyenne augmentera (ou diminuera) Y de -nombre-." Constante: "Elle représente la valeur attendue de Y lorsque les variables non centrées sont nulles et lorsque les variables centrées sont à leur moyenne."
- Conditions d'interaction. L'interprétation du coefficient d'un terme d'interaction ne devrait pas être problématique, que vous ayez standardisé vos variables ou les centrées (soit une seule variable de l'interaction, soit les deux). Fondamentalement, l'interprétation est que vous donnez normalement à un terme d'interaction (par exemple, vous êtes intéressé par l'effet de X1 sur Y et X1 interagit avec X2, l'effet total de X1 est donné par son coefficient + coeff. De l'interaction terme lorsque X2 est fixe), n'oubliez pas de contextualiser l'interprétation en suivant le point 7 ou 8, selon le type de transformation que vous avez fait.