Suivi des réponses à:
Ma question serait de savoir comment le réseau neuronal "apprend" ce qu'il doit faire dans une position qu'il n'a pas rencontrée. Dire que l'AZ réel exécute un SCTM en utilisant les biais + poids du réseau neuronal entraîné repousse simplement une étape vers la façon dont le réseau neuronal calcule ces valeurs. Si c'était par un jeu personnel aléatoire, sans aucune connaissance humaine, alors comment décide-t-il de la pondération d'une position qu'il n'a jamais vue?