Les réponses que j'ai reçues à la question sur la formation d'une ligne suivant un robot en utilisant des techniques d'apprentissage par renforcement m'ont amené à réfléchir à la façon de former un robot. Je crois qu'il y a essentiellement deux façons -
- Entraînez le robot physique.
- Modélisez le robot et simulez la formation.
- Ai-je oublié quelque chose?
L'approche 2 est certainement la meilleure approche. Cependant, une connaissance a priori du mouvement (réponse), un certain signal PWM (stimulus) provoquerait lorsque le robot est dans un état donné est requis. Le mouvement provoqué par un signal PWM peut dépendre de ( 1 ) la tension actuelle de la batterie, ( 2 ) de la masse du robot et de ( 3 ) la vitesse du courant (ai-je raté quelque chose?).
Comment modéliser un tel robot? Et comment puis-je le modéliser rapidement? Si je change la batterie ou ajoute quelques cartes et autres périphériques et change la masse du robot, je devrai remodeler et recycler le robot. Puis-je le faire en fournissant des PWM de stimulus aléatoires et en mesurant la réponse?
ajouté: Ma question connexe dans dsp.SE
Mise à jour: Une modification suggérée du titre par Ian mérite d'être mentionnée - " Comment puis-je modéliser un robot pour que si sa dynamique change, il n'a pas besoin d'un recyclage complet? " Je pense que c'est une bonne question aussi, mais différente de la celui que je demande ici. Je suis d'accord pour me recycler pour l'instant.