Outre les caractéristiques évidentes du classificateur comme
- coût de calcul,
- types de données attendus des fonctionnalités / étiquettes et
- l'adéquation à certaines tailles et dimensions d'ensembles de données,
quels sont les cinq premiers classificateurs (ou 10, 20?) à essayer en premier sur un nouvel ensemble de données dont on ne sait pas encore grand chose (par exemple la sémantique et la corrélation des caractéristiques individuelles)? Habituellement, j'essaie Naive Bayes, le plus proche voisin, l'arbre de décision et SVM - bien que je n'ai pas de bonne raison pour cette sélection autre que je les connais et comprends surtout comment ils fonctionnent.
Je suppose que l'on devrait choisir des classificateurs qui couvrent les approches de classification générale les plus importantes . Quelle sélection recommanderiez-vous, selon ce critère ou pour toute autre raison?
MISE À JOUR: Une formulation alternative pour cette question pourrait être: "Quelles approches générales de classification existent et quelles méthodes spécifiques couvrent les plus importantes / populaires / prometteuses?"