Questions marquées «multiarmed-bandit»







2
Limite de confiance supérieure dans l'apprentissage automatique
Je suis tombé sur la formule pour obtenir les limites de confiance supérieures sur le problème des bandits armés de k: clnNjenje-----√clnNinic\sqrt{\frac{\text{ln} N_i}{n_i}} où njenin_i est la quantité d'échantillons que nous avons pour ce bandit particulier et NjeNiN_iest la quantité totale d'échantillons que nous avons de tous les bandits. Le …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.