Soit représenter votre espace d'entrée, c'est-à-dire l'espace où résident vos points de données. Considérons une fonction telle qu'elle prend un point de votre espace d'entrée et le mappe à un point dans . Maintenant, disons que nous avons mappé tous vos points de données de à ce nouvel espace . Maintenant, si vous essayez de résoudre le svm linéaire normal dans ce nouvel espace au lieu de , vous remarquerez que tous les travaux antérieurs ont simplement la même apparence, sauf que tous les points sont représentés commeXΦ:X→FXFXFFXxiΦ(xi)et au lieu d'utiliser (produit scalaire) qui est le produit intérieur naturel de l'espace euclidien, nous le remplaçons par qui représente le produit intérieur naturel dans le nouvel espace . Donc, à la fin, votre ressemblerait,xTy⟨Φ(x),Φ(y)⟩Fw∗
w∗=∑i∈SVhiyiΦ(xi)
et donc,
⟨w∗,Φ(x)⟩=∑i∈SVhiyi⟨Φ(xi),Φ(x)⟩
De même,
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyj⟨Φ(xj),Φ(xi)⟩))
et votre règle de classification ressemble à: .cx=sign(⟨w,Φ(x)⟩+b)
Jusqu'ici tout va bien, il n'y a rien de nouveau, car nous avons simplement appliqué le SVM linéaire normal à un espace différent. Cependant, la partie magique est la suivante -
Disons qu'il existe une fonction telle que . Ensuite, nous pouvons remplacer tous les produits scalaires ci-dessus par . Un tel est appelé une fonction du noyau.k:X×X→Rk(xi,xj)=⟨Φ(xi),Φ(xj)⟩k(xi,xj)k
Par conséquent, vos et ressemblent à,
w∗b∗
⟨w∗,Φ(x)⟩=∑i∈SVhiyik(xi,x)
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyjk(xj,xi)))
Pour quelles fonctions du noyau la substitution ci-dessus est-elle valable? Eh bien, c'est une question légèrement impliquée et vous voudrez peut-être prendre du matériel de lecture approprié pour comprendre ces implications. Cependant, j'ajouterai simplement que ce qui précède est vrai pour le noyau RBF.
Pour répondre à votre question, "La situation est-elle telle que tous les vecteurs supports sont nécessaires pour le classement?" Oui. Comme vous pouvez le remarquer ci-dessus, nous calculons le produit interne de avec au lieu de calculer explicitement. Cela nous oblige à conserver tous les vecteurs de support pour la classification.wxw
Remarque: Les dans la section finale ici sont une solution au double du SVM dans l'espace et non . Est-ce à dire que nous devons connaître la fonction manière explicite? Heureusement non. Si vous regardez le double objectif, il se compose uniquement de produit interne et comme nous avons qui nous permet de calculer directement le produit interne, nous n'avons pas besoin de connaître explicitement . Le double objectif ressemble simplement à,
hiFXΦkΦ
max∑ihi−∑i,jyiyjhihjk(xi,xj)subject to : ∑iyihi=0,hi≥0