Je suis un peu nouveau dans le datamining / machine learning / etc. et j'ai lu quelques façons de combiner plusieurs modèles et exécutions du même modèle pour améliorer les prévisions.
Mon impression de la lecture de quelques articles (qui sont souvent intéressants et excellents sur la théorie et les lettres grecques mais courtes sur le code et les exemples réels) est que c'est censé se passer comme ceci:
Je prends un modèle ( knn
, RF
, etc.) et d' obtenir une liste des classificateurs entre 0 et 1. Ma question est de savoir comment COMBINONS chacune de ces listes de classificateurs? Dois-je exécuter les mêmes modèles sur mon ensemble d'entraînement afin que le nombre de colonnes entrant dans le modèle final soit le même ou y a-t-il une autre astuce?
Ce serait formidable si des suggestions / exemples incluaient du code R.
REMARQUE: il s'agit d'un ensemble de données avec 100 000 lignes dans l'ensemble d'apprentissage et 70 000 dans l'ensemble de test et 10 colonnes.