J'écris un script qui analyse les temps d'exécution des processus. Je ne suis pas sûr de leur distribution mais je veux savoir si un processus se déroule "trop longtemps". Jusqu'à présent, j'ai utilisé 3 écarts-types des derniers temps d'exécution (n> 30), mais on m'a dit que cela ne fournit rien d'utile si les données ne sont pas normales (ce qui ne semble pas être le cas). J'ai trouvé un autre test aberrant qui dit:
Trouvez l'intervalle inter quartile, qui est IQR = Q3 - Q1, où Q3 est le troisième quartile et Q1 est le premier quartile. Trouvez ensuite ces deux nombres:
a) Q1 - 1,5 * IQR b) Q3 + 1,5 * IQR
Le point est une valeur aberrante si <a ou> b
Mes données ont tendance à être des choses comme 2 sec, 3 sec, 2 sec, 5 sec, 300 sec, 4 sec, ... où 300 sec est évidemment une valeur aberrante.
Quelle méthode est la meilleure? La méthode IQR ou la méthode de déviation std?