Habituellement, la décision consiste à utiliser un noyau linéaire ou un noyau RBF (ou gaussien). Il y a deux facteurs principaux à considérer:
- La résolution du problème d'optimisation d'un noyau linéaire est beaucoup plus rapide, voir par exemple LIBLINEAR.
- En règle générale, la meilleure performance prédictive possible est meilleure pour un noyau non linéaire (ou du moins aussi bon que le noyau linéaire).
Il a été démontré que le noyau linéaire est une version dégénérée de RBF . Le noyau linéaire n’est donc jamais plus précis qu’un noyau RBF correctement réglé. En citant le résumé de l'article que j'ai lié:
L'analyse indique également que si la sélection complète du modèle à l'aide du noyau gaussien a été effectuée, il n'est pas nécessaire de prendre en compte la SVM linéaire.
Une règle de base est brièvement décrite dans le guide pratique de la NTU pour la classification des vecteurs (Annexe C).
Si le nombre d'entités est grand, il n'est peut-être pas nécessaire de mapper les données vers un espace dimensionnel supérieur. En d'autres termes, le mappage non linéaire n'améliore pas les performances. Utiliser le noyau linéaire est suffisant, et on ne cherche que le paramètre C.
Votre conclusion est plus ou moins juste, mais l'argument est inversé. En pratique, le noyau linéaire a tendance à très bien fonctionner lorsque le nombre d'entités est grand (par exemple, il n'est pas nécessaire de mapper vers un espace d'entités dimensionnel encore plus grand). Un exemple typique est la classification de documents, avec des milliers de dimensions dans l’espace de saisie.
Dans ces cas, les noyaux non linéaires ne sont pas nécessairement plus précis que les noyaux linéaires. Cela signifie essentiellement que les noyaux non linéaires perdent leur attrait: ils ont besoin de beaucoup plus de ressources pour s'entraîner avec un gain de performance prédictif faible, voire nul, alors pourquoi s'embêter.
TL; DR
Toujours essayer d'abord linéaire, car il est beaucoup plus rapide de s'entraîner (AND test). Si la précision suffit, félicitez-vous pour un travail bien fait et passez au problème suivant. Sinon, essayez un noyau non linéaire.