Quelles sont les meilleures méthodes pour ajuster le «mode» des données échantillonnées à partir d'une distribution continue?
Étant donné que le mode est techniquement indéfini (non?) Pour une distribution continue, je me demande vraiment `` comment trouvez-vous la valeur la plus courante ''?
Si vous supposez que la distribution parente est gaussienne, vous pouvez regrouper les données et trouver par exemple que le mode est l'emplacement du bac avec le plus grand nombre. Cependant, comment déterminez-vous la taille du bac? Existe-t-il des implémentations robustes? (c.-à-d. robuste aux valeurs aberrantes). J'utilise python
/ scipy
/ numpy
, mais je peux probablement traduire R
sans trop de difficulté.