Bonjour, j'ai une trame de données avec de grandes valeurs catégorielles sur 1600 catégories. Est-ce que je peux trouver des alternatives pour ne pas avoir plus de 1600 colonnes.
J'ai trouvé ce lien intéressant ci-dessous http://amunategui.github.io/feature-hashing/#sourcecode
Mais ils se convertissent en classe / objet dont je ne veux pas. Je veux ma sortie finale en tant que trame de données afin de pouvoir tester avec différents modèles d'apprentissage automatique? ou existe-t-il un moyen d'utiliser la matrice générée pour former les autres modèles d'apprentissage automatique autres que la régression logistique ou XGBoost?
Existe-t-il de toute façon que je peux implémenter?