Est-il possible de construire un modèle statistique qui prédit le prochain mouvement dans un graphique uniquement basé sur les mouvements passés et la structure du graphique?
J'ai fait un exemple pour illustrer le problème:
- Le temps est discret . À chaque tour, vous restez à votre nœud / sommet actuel ou vous vous déplacez vers l'un des nœuds connectés. Puisque le temps est discret et que vous pouvez tout au plus avancer d'un nœud à chaque tour, il n'y a pas de vitesse.
- Historique des itinéraires / mouvements passés: {A, B, C} - Et la position actuelle est: C
Prochains coups valides: C, B, X, Y, Z
- Si vous choisissez C vous restez fixe,
- si B vous reculez,
- et si X, Y ou Z implique d'avancer.
Il n'y a pas de pondération sur les liens ou les nœuds.
- Il n'y a pas de nœud de destination finale. Une partie du comportement de mouvement observé est aléatoire et une partie de celui-ci aura une certaine régularité.
Un modèle très simple - qui ne tient pas compte de l'historique des mouvements - prédirait simplement que C, B, X, Y et Z avaient chacun une probabilité de 1/5 d'être le prochain mouvement.
Mais sur la base de la structure et de l'historique du mouvement, je suppose qu'il est possible de faire un meilleur modèle statistique. Par exemple, X devrait avoir une probabilité plus faible, car on aurait pu s'y déplacer directement à partir du nœud B au tour précédent. De même, B devrait également avoir une probabilité plus faible car la personne aurait pu rester fixe au tour précédent.
Si l'utilisateur se déplace à dos B , puis l'histoire du mouvement ressemblera à ceci {A, B, C, B} et les mouvements valides seront A, B, C, D, E, X . Passer à C devrait avoir une probabilité plus faible, car vous auriez pu rester fixe. Passer à X devrait également avoir une probabilité plus faible, car vous auriez pu vous déplacer à partir de C lors du tour précédent. Des antécédents antérieurs peuvent également influer sur la prédiction, mais ils devraient avoir moins de poids que les antécédents récents, c'est-à-dire 2 tours il y a vous aurait pu rester en B , ou vous pourriez avoir déménagé à A, D, E, X - il y a 3 tours , vous aurait pu rester à un .
En regardant autour de moi, j'ai découvert que des problèmes similaires se posent dans:
- télécommunication mobile, où les opérateurs tentent de prédire dans quelle tour de cellule l'utilisateur se rendra ensuite afin de pouvoir passer en douceur la transmission des appels / données.
- navigation sur le Web, où les navigateurs / moteurs de recherche essaient de prédire la page à laquelle vous vous rendrez ensuite afin qu'ils puissent pré-charger et mettre en cache la page, de sorte que le temps d'attente soit réduit. De même, les applications cartographiques essaient de prédire les tuiles de carte que vous demanderez ensuite et de les précharger.
- et bien sûr l'industrie des transports.