Mes données consistent en plusieurs mesures continues et quelques variables fictives représentant les années pendant lesquelles les mesures ont été effectuées. Maintenant, je veux apprendre un réseau neuronal avec les données. Par conséquent, je normalise zScore toutes les variables, y compris les variables fictives. Cependant, je me demande si c'est une approche raisonnable, car la normalisation des variables muettes modifie leurs plages, ce qui les rend moins comparables si leurs distributions diffèrent. D'un autre côté, la non normalisation des variables factices pourrait également être contestable, car sans normalisation, leur influence sur la sortie des réseaux pourrait être sous-optimale.
Quelle est la meilleure approche pour gérer les variables fictives, les normaliser (zScore) ou les laisser telles quelles?