Je suis un peu confus avec la différence entre un SVM et un perceptron. Permettez-moi d'essayer de résumer ma compréhension ici, et n'hésitez pas à corriger où je me trompe et à compléter ce que j'ai manqué.
Le Perceptron n'essaie pas d'optimiser la "distance" de séparation. Tant qu'il trouve un hyperplan qui sépare les deux ensembles, c'est bien. SVM d'autre part essaie de maximiser le "vecteur de support", c'est-à-dire la distance entre deux points d'échantillonnage opposés les plus proches.
Le SVM essaie généralement d'utiliser une "fonction noyau" pour projeter les points d'échantillonnage dans un espace de grande dimension pour les rendre séparables linéairement, tandis que le perceptron suppose que les points d'échantillonnage sont séparables linéairement.