Je dois faire une régression logistique binaire avec beaucoup de variables indépendantes. La plupart d'entre elles sont binaires, mais quelques-unes des variables catégorielles ont plus de deux niveaux.
Quelle est la meilleure façon de gérer ces variables?
Par exemple, pour une variable avec trois valeurs possibles, je suppose que deux variables fictives doivent être créées. Ensuite, dans une procédure de régression par étapes, il est préférable de tester les deux variables muettes en même temps, ou de les tester séparément?
Je vais utiliser SPSS, mais je ne m'en souviens pas très bien, alors: comment SPSS gère-t-il cette situation?
De plus, pour une variable catégorielle ordinale, est-ce une bonne chose d'utiliser des variables fictives qui recréent l'échelle ordinale? (Par exemple, en utilisant trois variables nominales pour une variable ordinale à 4 états, mis 0-0-0
à niveau , de niveau , pour le niveau et de niveau , au lieu de , , et pour les 4 niveaux).2 3 41-0-0
1-1-0
1-1-1
0-0-0
1-0-0
0-1-0
0-0-1