Mon collègue et moi essayons de comprendre la différence entre la régression logistique et un SVM. De toute évidence, ils optimisent différentes fonctions objectives. Un SVM est-il aussi simple que de dire qu'il s'agit d'un classificateur discriminant qui optimise simplement la perte de charnière? Ou est-ce plus complexe que ça? Comment les vecteurs de support entrent-ils en jeu? Et les variables slack? Pourquoi ne pouvez-vous pas avoir de SVM profond comme vous ne pouvez pas avoir un réseau neuronal profond avec des fonctions d'activation sigmoïde?