J'ai le minimum, la moyenne et le maximum de certains ensembles de données, disons 10, 20 et 25. Y a-t-il un moyen de:
créer une distribution à partir de ces données, et
Il existe un nombre infini de distributions possibles qui seraient cohérentes avec ces quantités d'échantillon.
savoir quel pourcentage de la population se situe probablement au-dessus ou au-dessous de la moyenne
En l'absence de certaines hypothèses probablement injustifiées, pas en général - du moins pas avec beaucoup de sens que cela aura un sens. Les résultats dépendront en grande partie de vos hypothèses (il n'y a pas beaucoup d'informations dans les valeurs elles-mêmes, bien que certains arrangements particuliers donnent des informations utiles - voir ci-dessous).
Il n'est pas difficile de trouver des situations où les réponses à la question des proportions peuvent être très différentes. Lorsqu'il existe des réponses très différentes et cohérentes avec les informations, comment sauriez-vous dans quelle situation vous vous trouvez?
Plus de détails peuvent donner des indices utiles mais en l'état (sans même une taille d'échantillon, bien que ce soit probablement au moins 2, ou 3 si la moyenne n'est pas à mi-chemin entre les points d'extrémité *), vous n'obtiendrez pas nécessairement beaucoup de valeur sur cette question . Vous pouvez essayer d'obtenir des limites, mais dans de nombreux cas, ils ne restreindront pas beaucoup les choses.
* en fait, si la moyenne est proche d'un point final, vous pouvez obtenir une limite inférieure sur la taille de l'échantillon. Par exemple, si au lieu de 10,20,25 pour votre min / moyenne / max vous aviez 10 24 25 alors devrait être d'au moins 15, et cela suggérerait également que la plupart de la population était supérieure à 24; c'est quelque chose. Mais si on disait 10,18,25, il est beaucoup plus difficile de se faire une idée utile de la taille de l'échantillon, sans parler de la proportion inférieure à la moyenne.n