Cette question pourrait aller ici ou sur SO peut-être ...
Supposons que votre jeu de données de formation contienne à la fois des données catégorielles et continues telles que cette configuration:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
Et la variable dépendante à prévoir est le coût annuel du vétérinaire. Je suis un peu confus quant aux techniques spécifiques disponibles pour traiter un tel ensemble de données. Quelles sont les méthodes couramment utilisées pour traiter les ensembles de données qui sont un mélange de données continues et catégorielles?