Q: "... comment interpréter la valeur x2" High "? Par exemple, quel effet les" High "x2s ont-ils sur la variable de réponse dans l'exemple donné ici ??
R: Vous avez sans aucun doute remarqué qu'il n'y a aucune mention de x2 = "High" dans la sortie. Pour le moment, x2High est choisi comme "cas de base". C'est parce que vous avez proposé une variable de facteur avec le codage par défaut pour les niveaux malgré un ordre qui aurait été L / M / H plus naturellement pour l'esprit humain. Mais "H" étant lexicalement avant "L" et "M" dans l'alphabet, a été choisi par R comme cas de base.
Puisque 'x2' n'a pas été ordonné, chacun des contrastes rapportés était relatif à x2 = "élevé" et donc x2 == "faible" a été estimé à -0,78 par rapport à x2 = "élevé". Pour le moment, l'interception est la valeur estimée de "Y" lorsque x2 = "High" et x1 = 0. Vous voudrez probablement relancer votre régression après avoir changé l'ordre des niveaux (mais pas fait le facteur ordonné).
x2a = factor(x2, levels=c("Low", "Medium", "High"))
Ensuite, votre estimation «moyenne» et «élevée» sera plus conforme à ce que vous attendez.
Modifier: Il existe d'autres dispositions de codage (ou plus précisément des dispositions de la matrice du modèle.) Le choix par défaut pour les contrastes dans R est "contrastes de traitement" qui spécifie un niveau de facteur (ou une combinaison particulière de niveaux de facteur) comme niveau de référence et rapports. différences moyennes estimées pour d'autres niveaux ou combinaisons. Vous pouvez cependant avoir le niveau de référence comme la moyenne globale en forçant l'interception à 0 (non recommandé) ou en utilisant l'un des autres choix de contraste:
?contrasts
?C # which also means you should _not_ use either "c" or "C" as variable names.
Vous pouvez choisir différents contrastes pour différents facteurs, bien que cela semble imposer une charge d'interprétation supplémentaire. S-Plus utilise les contrastes Helmert par défaut, et SAS utilise les contrastes de traitement mais choisit le dernier niveau de facteur plutôt que le premier comme niveau de référence.