Votre question est un parfait exemple de modèles de régression avec des prédicteurs quantitatifs et qualitatifs . Plus précisément, les trois groupes d'âge - - sont les variables qualitatives et les variables quantitatives sont les habitudes d'achat et la perte de poids (je suppose que c'est parce que vous calculez les corrélations).1,2,&3
Je dois souligner que c'est une bien meilleure façon de modéliser que de calculer des corrélations séparées par groupe, car vous avez plus de données à modéliser, donc vos estimations d'erreur (valeurs p, etc.) seront plus fiables. Une raison plus technique est les degrés de liberté plus élevés qui en résultent dans la statistique du test t pour tester la signification des coefficients de régression.
Fonctionnant selon la règle selon laquelle les prédicteurs qualitatifs peuvent être gérés par variables d'indicateur, seules deux variables d'indicateur, , sont nécessaires ici et sont définies comme suit:cc−1X1,X2
X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.
Cela implique que le groupe est représenté par ; représenter votre réponse - habitude achats en et la perte de poids variable explicative quantitative comme . Vous êtes maintenant adapté à ce modèle linéaire3X1=0,X2=0YW
E[Y]=β0+β1X1+β2X2+β3W.
La question évidente est la suivante: est-ce important de changer et (parce que j'ai choisi au hasard les habitudes d'achat comme variable de réponse). La réponse est oui - les estimations des coefficients de régression changeront, mais le test de "l'association" entre conditionnés sur les groupes (ici le test t, mais c'est la même chose que le test de corrélation pour une variable prédictive unique) ne changera pas changement. Plus précisément,
WY
E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
ce qui équivaut à avoir 3 lignes distinctes, en fonction des groupes, si vous tracer vs . C'est un bon moyen de visualiser ce pour quoi vous testez est logique (essentiellement une forme d'EDA et de vérification de modèle, mais vous devez distinguer correctement les observations groupées). Trois lignes parallèles indiquent qu'il n'y a pas d'interaction entre les trois groupes et , et beaucoup d'interaction implique que ces lignes vont se croiser.
YWW
Comment font les tests que vous demandez. Fondamentalement, une fois que vous avez ajusté le modèle et obtenu les estimations, vous devez tester certains contrastes. Spécifiquement pour vos comparaisons:
Group 2 vs Group 3: β2+β0−β0=0,
Group 1 vs Group 3: β1+β0−β0=0,
Group 2 vs Group 1: β2+β0−(β0+β1)=0.