J'ai un ensemble de données qui contient à la fois des variables catégorielles et des variables continues. On m'a conseillé de transformer les variables catégorielles en variables binaires pour chaque niveau (c'est-à-dire A_level1: {0,1}, A_level2: {0,1}) - je pense que certains ont appelé cela des "variables factices".
Cela dit, serait-il trompeur de centrer et de mettre à l'échelle l'ensemble des données avec les nouvelles variables? Il semble que je perdrais le sens "on / off" des variables.
S'il est trompeur, cela signifie-t-il que je devrais centrer et mettre à l'échelle les variables continues séparément, puis les ajouter à nouveau à mon ensemble de données?
TIA.