Certaines techniques de modélisation prédictive sont plus conçues pour gérer des prédicteurs continus, tandis que d'autres sont meilleures pour gérer des variables catégorielles ou discrètes. Il existe bien sûr des techniques pour transformer un type en un autre (discrétisation, variables muettes, etc.). Cependant, existe-t-il des techniques de modélisation prédictive conçues pour gérer les deux types d'entrée en même temps sans simplement transformer le type des entités? Dans l'affirmative, ces techniques de modélisation ont-elles tendance à mieux fonctionner sur des données pour lesquelles elles sont plus adaptées?
La chose la plus proche que je connais serait que les arbres de décision généralement manipuler des données discrètes bien et ils gèrent des données continues sans nécessiter l' avant discrétisation. Cependant, ce n'est pas tout à fait ce que je cherchais car, en réalité, les divisions sur les caractéristiques continues ne sont qu'une forme de discrétisation dynamique.
Pour référence, voici quelques questions connexes non dupliquées:
- Comment les fractionnements d'arbre de décision devraient-ils être mis en œuvre lors de la prévision des variables continues?
- Puis-je utiliser la régression multiple lorsque j'ai des prédicteurs catégoriels et continus mixtes?
- Est-il jamais judicieux de traiter les données catégoriques comme continues?
- Analyse continue et catégorielle des données variables