Regret interne dans l'optimisation convexe en ligne


19

L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation similaire pour le regret interne? (Je ne suis pas totalement sûr de ce que cela signifierait exactement.)


Est-il possible d'ajouter une brève description des regrets internes à la question?
Moritz

Dans les «experts» habituels, définir un regret interne signifierait que rétrospectivement, vous ne voudriez pas passer d'une action à une autre, de manière cohérente tout au long de l'histoire. Le papier Blum-Mansour est probablement la meilleure référence pour les regrets internes et externes: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

Réponses:


9

Essayez «l'apprentissage sans regret dans les jeux convexes» par Gordon, Greenwald et Marks http://portal.acm.org/citation.cfm?id=1390202 . Son résumé sonne comme s'il répondait probablement à votre question, ou au moins quiconque répondant à cette question citerait ou serait cité par cet article.


0

Cet article d'Avrim Blum met en évidence un lien entre les regrets externes et internes. Selon son résumé, le regret externe est une mesure de la façon dont un algorithme est comparé à la meilleure action fixe, tandis que le regret interne se compare à la meilleure variation de cette méthode (meilleure permutation fixe des sorties, comme le signalement de la classe A chaque fois que l'algorithme d'origine a signalé classe B).


1
L'article de Blum-Mansour n'est pas dans le cadre de "l'optimisation convexe en ligne", mais plutôt dans le cadre "d'experts" linéaire. Ma question est de savoir si quelque chose de similaire ou un autre algorithme de regret interne direct peut être appliqué dans le cadre convexe.
Noam
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.