J'ai 12 ensembles d'entraînement positifs (cellules cancéreuses traitées avec des médicaments avec chacun des 12 mécanismes d'action différents). Pour chacun de ces ensembles d'entraînement positifs, je voudrais former une machine à vecteur de support pour la distinguer d'un ensemble négatif de taille égale échantillonné de l'expérience. Chaque ensemble a entre 1 000 et 6 000 cellules, et il y a 476 caractéristiques (caractéristiques d'image) de chaque cellule, chacune étant mise à l'échelle linéairement à [0, 1].
J'utilise LIBSVM et le noyau RVB gaussien. En utilisant cinq fois la validation croisée, j'ai fait une recherche dans la grille pour log₂ C ∈ [-5, 15] et log₂ ɣ ∈ [-15, 3]. Les résultats sont les suivants:
J'ai été déçu qu'il n'y ait pas un seul ensemble de paramètres qui donnent des précisions élevées pour les 12 problèmes de classification. J'ai également été surpris que les grilles ne montrent généralement pas une région de haute précision entourée de précisions plus faibles. Est-ce que cela signifie simplement que j'ai besoin d'agrandir l'espace des paramètres de recherche, ou la recherche dans la grille indique-t-elle que quelque chose d'autre ne va pas?