Questions marquées «online-learning»

1
Quels sont les meilleurs compromis temps / erreur possibles pour une solution approximative de programmes linéaires?
Pour le concret, considérons le LP pour résoudre un jeu à somme nulle à deux joueurs où chaque joueur a actions. Supposons que chaque entrée de la matrice de gains soit au plus 1 en valeur absolue. Par souci de simplicité, ne faisons aucune hypothèse de rareté.AnnnAAA Supposons que le …

1
Le problème de Warren Buffett
Voici une abstraction d'un problème d'apprentissage en ligne / bandit sur lequel j'ai travaillé l'été. Je n'ai jamais vu un problème comme celui-ci auparavant, et cela semble assez intéressant. Si vous connaissez un travail connexe, j'apprécierais les références. Le problème Le réglage est celui des bandits multi-armés. Vous avez N …

2
Regret interne dans l'optimisation convexe en ligne
L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation similaire pour le regret interne? (Je ne suis pas totalement sûr de ce que …


5
Quelles sont les bonnes références pour comprendre l'apprentissage en ligne?
Plus précisément, je demande des ressources pour en savoir plus sur les systèmes d'apprentissage automatique qui peuvent mettre à jour leurs réseaux de croyances respectifs (ou équivalent) pendant le fonctionnement. J'en ai même rencontré quelques-uns, même si je n'ai pas réussi à les mettre en signet. Comme vous pouvez l'imaginer, …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.