Je suis nouveau dans l'apprentissage automatique et j'essaie d'utiliser scikit-learn (sklearn) pour résoudre un problème de classification. Les deux DecisionTree et SVM peuvent former un classificateur à ce problème.
J'utilise sklearn.ensemble.RandomForestClassifier
et sklearn.svm.SVC
pour ajuster les mêmes données de formation (environ 500 000 entrées avec 50 fonctionnalités par entrée). Le RandomForestClassifier sort avec un classificateur en environ une minute. Le SVC utilise plus de 24 heures et continue de fonctionner.
Pourquoi le SVC fonctionne-t-il si inefficacement? L'ensemble de données est-il trop volumineux pour SVC ? SVC est-il inapproprié pour un tel problème?