En découvrant l'apprentissage automatique, je vois différentes techniques intéressantes telles que:
- régler automatiquement les algorithmes avec des techniques telles que
grid search
, - obtenir des résultats plus précis grâce à la combinaison de différents algorithmes du même "type", c'est-à-dire
boosting
, - obtenir des résultats plus précis grâce à la combinaison de différents algorithmes (mais pas du même type d'algorithmes), c'est-à-dire
stacking
, - et probablement beaucoup plus que je dois encore découvrir ...
Ma question est la suivante: il y a toutes ces pièces. Mais est-il possible de les assembler pour créer un algorithme qui prend en entrée des données nettoyées et génère de bons résultats en tirant le meilleur parti de toutes les techniques? (Bien sûr, ce sera probablement moins efficace qu'un scientifique des données professionnel, mais il sera meilleur que moi!) Si oui, avez-vous des exemples de codes ou connaissez-vous des cadres qui peuvent le faire?
EDIT: Après quelques réponses, il semble qu'un rétrécissement doit être fait. Prenons un exemple, nous avons une colonne avec des données catégorielles, appelons-la y
et nous voulons la prédire à partir de données numériques X
qui sont soit des mannequins soit de vraies données numériques (hauteur, température). Nous supposons que le nettoyage a été effectué précédemment. Existe-t-il un algorithme qui peut prendre ces données et produire une prédiction? (en testant plusieurs algorithmes, en les réglant, en les boostant, etc.) Si oui, est-ce efficace sur le plan du calcul (les calculs sont-ils effectués dans un délai raisonnable si nous comparons à un algorithme normal), et avez-vous un exemple de code?
auto.arima
(de la forecast
bibliothèque) peuvent être meilleures que les humains - Rob Hyndman l'a mentionné à plusieurs reprises dans ses présentations. Il existe donc des domaines où certaines sortes d '«apprentissage automatique» sont appliquées avec succès.