J'espère pouvoir poser cette question correctement. J'ai accès aux données play-by-play, c'est donc plus un problème avec la meilleure approche et la construction des données correctement.
Ce que je cherche à faire, c'est de calculer la probabilité de gagner un match dans la LNH compte tenu du score et du temps restant dans le règlement. Je pense que je pourrais utiliser une régression logistique, mais je ne sais pas à quoi devrait ressembler l'ensemble de données. Aurais-je plusieurs observations par match et pour chaque tranche de temps qui m'intéresse? Aurais-je une observation par match et des modèles séparés par tranche de temps? La régression logistique est-elle la bonne voie à suivre?
Toute aide que vous pourrez apporter sera très appréciée!
Meilleures salutations.