J'essaie d'automatiser la détection des valeurs aberrantes dans les séries chronologiques et j'ai utilisé une modification de la solution proposée par Rob Hyndman ici .
Disons que je mesure les visites quotidiennes d'un site Web de divers pays. Pour certains pays où les visites quotidiennes sont de quelques centaines ou milliers, ma méthode semble fonctionner raisonnablement.
Cependant, dans les cas où un pays ne mène qu'à 1 ou 2 visites par jour, les limites de l'algorithme sont très étroites (par exemple 1 ± 0,001) et donc les 2 visites sont considérées comme aberrantes. Comment pourrais-je détecter automatiquement de tels cas et comment les traiter pour identifier les valeurs aberrantes? Je ne voudrais pas fixer un seuil manuel de, disons, 100 visites par jour.
Je vous remercie!