La question:
"Quelle méthode d'imputation est le meilleur choix" dépend toujours de l'ensemble de données que vous regardez
En prenant la moyenne, en général, c'est une méthode d'imputation valide. Comme quelqu'un l'a déjà mentionné, il est facile à expliquer pour les publications et il a ses avantages en termes de vitesse de calcul.
La méthode de l'imputation moyenne est un bon choix pour les séries qui fluctuent de manière aléatoire autour d'une certaine valeur / niveau.
Pour la série présentée, la moyenne ne semble pas appropriée. Puisqu'il s'agit également d'une seule variable, vous ne pouvez pas utiliser les algorithmes multivariés classiques fournis par les souris, Amelia, VIM.
Il faudrait surtout regarder les algorithmes de séries chronologiques. Une approche simple et pourtant bonne pour votre exemple serait une interpolation linéaire.
library(imputeTS)
x <- c(1,8,12,14,NA,NA,19)
na.interpolation(x)
Voici la sortie pour une interpolation linéaire:
[1] 1.00000 8.00000 12.00000 14.00000 15.66667 17.33333 19.00000
C'est probablement un meilleur résultat que la moyenne.
Il existe également des méthodes de séries chronologiques plus avancées dans le package imputeTS (par moi) ou une dans le package de prévisions (par Rob Hyndman)