Pour utiliser SVM ou Neural Network, il doit transformer (encoder) des variables catégorielles en variables numériques, la méthode normale dans ce cas est d'utiliser des valeurs binaires 0-1 avec la k-ème valeur catégorielle transformée en (0,0, .. ., 1,0, ... 0) (1 est en position k-ème). Existe-t-il d'autres méthodes pour ce faire, en particulier lorsqu'il existe un grand nombre de valeurs catégorielles (par exemple 10000) telles que la représentation 0-1 introduira un grand nombre de dimensions supplémentaires (unités d'entrée) dans Neural Network qui ne semblent pas tout à fait souhaitées ou attendues ?
Je pose des questions sur les stratégies générales.