Questions marquées «proofs»

2
Pourquoi Q-learning ne converge-t-il pas lors de l'utilisation de l'approximation de fonction?
L'algorithme tabulaire d'apprentissage Q est garanti pour trouver la fonction QQQ optimale , Q∗Q∗Q^* , à condition que les conditions suivantes (les conditions Robbins-Monro ) concernant le taux d'apprentissage soient remplies ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)&lt;∞∑tαt2(s,a)&lt;∞\sum_{t} \alpha_t^2(s, a) < \infty où αt(s,a)αt(s,a)\alpha_t(s, a) signifie le taux d'apprentissage utilisé lors …

8
Preuve que l'intelligence générale artificielle est possible
Il est supposé en informatique que l'esprit humain peut être reproduit avec une machine de Turing, donc l'intelligence générale artificielle (AGI) est possible. Assumer le contraire, c'est croire en quelque chose de mystique, et les croyances mystiques sont fausses. Je ne connais aucun autre argument selon lequel AGI est possible, …
11 philosophy  agi  proofs 

1
Quelles sont les implications du théorème «Pas de déjeuner gratuit» pour l'apprentissage automatique?
Le théorème No Free Lunch (NFL) déclare (voir l'article Coevolutionary Free Lunches de David H. Wolpert et William G. Macready) deux algorithmes sont équivalents lorsque leurs performances sont moyennées sur tous les problèmes possibles Le théorème du «déjeuner gratuit» est-il vraiment vrai? Qu'est-ce que cela signifie réellement? Un bel exemple …
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.