J'ai appris que, pour créer un modèle de régression, nous devons prendre soin des variables catégorielles en les convertissant en variables fictives. Par exemple, si, dans notre ensemble de données, il existe une variable comme l'emplacement:
Location
----------
Californian
NY
Florida
Nous devons les convertir comme:
1 0 0
0 1 0
0 0 1
Cependant, il a été suggéré que nous devions éliminer une variable fictive, quel que soit le nombre de variables fictives.
Pourquoi devons-nous éliminer une variable fictive?