Lorsque vous transformez des variables, devez-vous utiliser la même transformation? Par exemple, puis-je choisir et choisir des variables transformées différemment, comme dans:
Soit, l'âge, la durée de l'emploi, la durée de résidence et le revenu.
Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3)
Ou devez-vous être cohérent avec vos transformations et utiliser tout de même? Un péché:
Y = B1*log(x1) + B2*log(x2) + B3*log(x3)
Je crois comprendre que le but de la transformation est de résoudre le problème de la normalité. En examinant les histogrammes de chaque variable, nous pouvons constater qu'ils présentent des distributions très différentes, ce qui me porte à croire que les transformations requises sont différentes, variable par variable.
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav",
use.value.labels=T, to.data.frame=T)
hist(df[1:7])
Enfin, quelle est la validité de la transformation de variables à l'aide de où a valeur? Cette transformation doit-elle être cohérente pour toutes les variables ou est-elle utilisée ad hoc même pour les variables qui n'incluent pas des ?x n 0 0
## R Code
plot(df[1:7])