Je dois clarifier immédiatement que je suis un développeur de logiciels pratiquant, pas un statisticien, et que mon cours de statistiques au collège était il y a très longtemps…
Cela dit, j'aimerais savoir s'il existe une méthode pour accumuler un ensemble de statistiques descriptives qui pourraient ensuite être utilisées pour produire un boxplot, qui n'implique pas le stockage d'un tas d'échantillons individuels?
Ce que j'essaie de faire est de produire un résumé graphique des temps de service de file d'attente dans un processus complexe à plusieurs files d'attente. Dans le passé, j'ai utilisé un package appelé tnftools qui permettait d'accumuler de gros échantillons et de les post-traiter dans un joli graphique des temps de réponse et des valeurs aberrantes… Mais les tnftools ne sont pas disponibles pour ma plate-forme actuelle.
Idéalement, j'aimerais pouvoir accumuler un ensemble de statistiques descriptives "à la volée" au cours du processus, puis extraire les données pour analyse à la demande. Mais je ne peux pas simplement faire accumuler des échantillons par le processus car la mémoire / E / S impliquée dans cette opération aurait un impact inacceptable sur les performances du système.