Supposons que j'ai un panel de variables explicatives , pour , , ainsi qu'un vecteur de variables binaires dépendantes du résultat . Donc n'est observé qu'au moment final et pas à un moment antérieur. Le cas tout à fait général est d'avoir plusieurs pour pour chaque unité à chaque instant , mais concentrons-nous sur le cas par souci de concision. i = 1 . . . N t = 1 . . . T Y i T Y T X i j t j = 1 ... K i t K = 1
Les applications de ces paires "déséquilibrées" avec des variables explicatives temporelles corrélées sont par exemple (cours des actions quotidiennes, dividendes trimestriels), (bulletins météorologiques quotidiens, ouragans annuels) ou (caractéristiques de la position des échecs après chaque mouvement, résultat de la victoire / de la perte à la fin du jeu).
Je suis intéressé par les coefficients de régression (éventuellement non linéaires) pour faire la prédiction de , sachant que dans les données d'entraînement, étant donné les premières observations de pour , cela conduit au résultat final X i t t < T Y i T
Issu d'un contexte d'économétrie, je n'ai pas vu beaucoup de modélisation de régression appliquée à ces données. OTOH, j'ai vu les techniques d'apprentissage automatique suivantes appliquées à ces données:
- effectuer un apprentissage supervisé sur l'ensemble des données, par exemple en minimisant
en extrapolant / imputant simplement le observé à tous les points précédents dans le temps
Cela semble "faux" car il ne tiendra pas compte de la corrélation temporelle entre les différents points dans le temps.
- faire un apprentissage par renforcement tel que la différence temporelle avec le paramètre d'apprentissage et le paramètre d'actualisation , et résoudre récursivement pour par à partir deλ β t t = T
avec le gradient de par rapport à . f ( ) β
Cela semble plus "correct" car il prend en compte la structure temporelle, mais les paramètres et sont plutôt "ad hoc".λ
Question : existe-t-il de la littérature sur la façon de mapper les techniques d'apprentissage supervisé / renforcé ci-dessus dans un cadre de régression tel qu'il est utilisé dans les statistiques / économétrie classiques? En particulier, j'aimerais pouvoir estimer les paramètres en une seule fois (c'est-à-dire pour tous les simultanément) en faisant des moindres carrés (non linéaires) ou un maximum de vraisemblance sur des modèles tels que t = 1 ... T
Je serais également intéressé de savoir si la différence temporelle d'apprentissage des méta-paramètres et pourrait être récupérée à partir d'une formulation à maximum de vraisemblance.λ