Le vénérable algorithme théorique du graphe du chemin le plus court A * et les améliorations ultérieures (par exemple, Hierarchical Annotated A *) est clairement la technique de choix pour la recherche de chemin dans le développement de jeux.
Au lieu de cela, il me semble simplement que RL est un paradigme plus naturel pour déplacer un personnage dans un espace de jeu.
Et pourtant, je ne connais aucun développeur de jeu qui ait mis en œuvre un moteur de recherche de cheminement basé sur l'apprentissage par renforcement. (Je ne déduis pas de cela que l'application de RL dans le pathfinding est 0, juste qu'elle est très petite par rapport à A * et à ses amis.)
Quelle que soit la raison, ce n'est pas parce que ces développeurs ne connaissent pas RL, comme en témoigne le fait que RL est fréquemment utilisé ailleurs dans le moteur de jeu.
Cette question n'est pas un prétexte pour donner un avis sur la RL en matière d'orientation; en fait, je suppose que la préférence tacite pour A * et al. sur RL est correct - mais cette préférence n'est pas évidente pour moi et je suis très curieux de savoir pourquoi, en particulier de quiconque a essayé d'utiliser RL pour trouver le chemin.