J'ai lu l'article d'Alexandru Niculescu-Mizil et Rich Caruana " Obtention de probabilités calibrées à partir du boost " et la discussion dans ce fil. Cependant, j'ai toujours du mal à comprendre et à implémenter la logistique ou la mise à l' échelle de Platt pour calibrer la sortie de mon classificateur de boosting multi-classes (boost doux avec moignons de décision).
Je connais un peu les modèles linéaires généralisés, et je pense comprendre comment fonctionnent les méthodes logistiques et d'étalonnage de Platt dans le cas binaire, mais je ne suis pas sûr de savoir comment étendre la méthode décrite dans l'article au cas multi-classes.
Le classificateur que j'utilise génère les informations suivantes:
- = nombre de votes émis par le classificateur pour la classe j pour l'échantillon i en cours de classification
- = classe estimée
À ce stade, j'ai les questions suivantes:
Q1: Dois-je utiliser un logit multinomial pour estimer les probabilités? ou est-ce que je peux toujours faire ceci avec la régression logistique (par exemple d'une manière 1 contre tous )?
Q2: Comment définir les variables cibles intermédiaires (par exemple, comme dans la mise à l'échelle de Platt) pour le cas multi-classes?
Q3: Je comprends que cela pourrait être beaucoup demander, mais quelqu'un serait-il disposé à esquisser le pseudo-code pour ce problème? (à un niveau plus pratique, je suis intéressé par une solution dans Matlab).