Il ne semble pas y avoir de méthode standard pour traiter les données manquantes dans le contexte de la famille de modèles de lissage exponentiel. En particulier, l'implémentation R appelée ets dans le package de prévision semble ne prendre que la sous-séquence la plus longue sans données manquantes, et le livre "Forecasting with Exponential Smoothing" de Hyndman et al. ne semble pas du tout parler de données manquantes.
Je voudrais faire un peu plus, si mes utilisateurs me le demandent explicitement (et si les données manquantes ne se produisent pas trop près les unes des autres ou dans trop de périodes qui sont exactement à une saison d'intervalle). En particulier, ce que j'ai à l'esprit est le suivant. Lors de la simulation, chaque fois que je rencontrais une valeur manquante , je substituais la prévision ponctuelle actuelle à , de sorte que . Par exemple, cela rendrait le point de données non pris en compte pour le processus d'optimisation des paramètres.
Une fois que j'ai un ajustement raisonnable pour les paramètres, je peux estimer l'écart-type des erreurs (supposé normal avec la moyenne ) et vérifier que l'utilisation des valeurs de générées à partir de cette distribution ne diminue pas la probabilité d'un facteur important. J'utiliserais également ces valeurs pour la prévision (en utilisant la simulation).
Y a-t-il des pièges connus avec cette méthode?