Informatique théorique online-learning

1

Quels sont les meilleurs compromis temps / erreur possibles pour une solution approximative de programmes linéaires?

Pour le concret, considérons le LP pour résoudre un jeu à somme nulle à deux joueurs où chaque joueur a actions. Supposons que chaque entrée de la matrice de gains soit au plus 1 en valeur absolue. Par souci de simplicité, ne faisons aucune hypothèse de rareté.AnnnAAA Supposons que le …

19 ds.algorithms approximation-algorithms online-learning linear-programming

1

Le problème de Warren Buffett

Voici une abstraction d'un problème d'apprentissage en ligne / bandit sur lequel j'ai travaillé l'été. Je n'ai jamais vu un problème comme celui-ci auparavant, et cela semble assez intéressant. Si vous connaissez un travail connexe, j'apprécierais les références. Le problème Le réglage est celui des bandits multi-armés. Vous avez N …

19 machine-learning lg.learning online-learning

2

Regret interne dans l'optimisation convexe en ligne

L '"optimisation convexe en ligne" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) généralise les algorithmes d'apprentissage de la "minimisation des regrets" d'un paramètre linéaire à un paramètre convexe et donne un bon "regret externe" . Existe-t-il une généralisation similaire pour le regret interne? (Je ne suis pas totalement sûr de ce que …

19 lg.learning online-learning

1

Séparation entre les équilibres corrélés grossiers et les équilibres corrélés

Je cherche des exemples de techniques pour prouver le prix des bornes de l'anarchie qui ont le pouvoir de séparer le prix de l'anarchie sur les équilibres corrélés grossiers (l'ensemble limitatif de la dynamique sans regret externe) du prix de l'anarchie sur les équilibres corrélés (la limite ensemble de dynamiques …

16 gt.game-theory online-learning

5

Quelles sont les bonnes références pour comprendre l'apprentissage en ligne?

Plus précisément, je demande des ressources pour en savoir plus sur les systèmes d'apprentissage automatique qui peuvent mettre à jour leurs réseaux de croyances respectifs (ou équivalent) pendant le fonctionnement. J'en ai même rencontré quelques-uns, même si je n'ai pas réussi à les mettre en signet. Comme vous pouvez l'imaginer, …

10 reference-request machine-learning lg.learning ai.artificial-intel online-learning

Questions marquées «online-learning»