J'essaie de trouver une métrique pour mesurer la non-uniformité d'une distribution pour une expérience que je lance. J'ai une variable aléatoire qui devrait être uniformément distribuée dans la plupart des cas, et j'aimerais pouvoir identifier (et peut-être mesurer le degré de) des exemples d'ensembles de données où la variable n'est pas uniformément distribuée dans une certaine marge.
Un exemple de trois séries de données avec chacune 10 mesures représentant la fréquence de l'occurrence de quelque chose que je mesure pourrait être quelque chose comme ceci:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
J'aimerais pouvoir distinguer les distributions comme c de celles comme a et b, et mesurer l'écart de c par rapport à une distribution uniforme. De manière équivalente, s'il existe une métrique pour savoir à quel point une distribution est uniforme (écart std proche de zéro?), Je peux peut-être l'utiliser pour distinguer celles avec une variance élevée. Cependant, mes données peuvent simplement avoir une ou deux valeurs aberrantes, comme l'exemple c ci-dessus, et je ne sais pas si cela sera facilement détectable de cette façon.
Je peux pirater quelque chose pour le faire dans un logiciel, mais je cherche des méthodes / approches statistiques pour le justifier formellement. J'ai pris un cours il y a des années, mais les statistiques ne sont pas mon domaine. Cela semble être quelque chose qui devrait avoir une approche bien connue. Désolé si tout cela est complètement à tête d'os. Merci d'avance!