Questions marquées «data-preprocessing»


2
La forêt aléatoire a-t-elle besoin de variables d'entrée pour être mise à l'échelle ou centrée?
Mes variables d'entrée ont des dimensions différentes. Certaines variables sont décimales tandis que d'autres sont des centaines. Est-il essentiel de centrer (soustraire la moyenne) ou de mettre à l'échelle (diviser par l'écart-type) ces variables d'entrée afin de rendre les données sans dimension lors de l'utilisation d'une forêt aléatoire?

2
Filets neuronaux: une seule variable à chaud écrasante continue?
J'ai des données brutes qui ont environ 20 colonnes (20 fonctionnalités). Dix d'entre elles sont des données continues et 10 d'entre elles sont catégoriques. Certaines des données catégorielles peuvent avoir comme 50 valeurs différentes (États-Unis). Après avoir prétraité les données, les 10 colonnes continues deviennent 10 colonnes préparées et les …



2
Qu'est-ce que la bucketisation?
J'ai fait le tour pour trouver une explication claire de la «bucketisation» dans l'apprentissage automatique sans succès. Ce que je comprends jusqu'à présent, c'est que la bucketisation est similaire à la quantification dans le traitement numérique du signal où une plage de valeurs continues est remplacée par une valeur discrète. …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.