Comment dois-je interpréter la hauteur des tracés de densité:
Par exemple, dans le graphique ci-dessus, le pic est d'environ 0,07 à x = 18. Puis-je en déduire qu'environ 7% des valeurs sont d'environ 18? Puis-je être plus précis que ça? Il y a aussi un deuxième pic à x = 30 avec une hauteur de 0,02. Cela signifierait-il qu'environ 2% des valeurs se situent autour de 30?
Edit: La question sur Est-ce qu'une valeur de distribution de probabilité supérieure à 1 peut être OK?traite de la valeur de probabilité de> 1 qui n'est pas du tout un problème ici. Il discute également de cela en relation avec le classfier naïf de Bayes qui n'est pas non plus le point ici. Je veux avoir, dans un langage simple, les inférences numériques que nous pouvons tirer de ces courbes de densité. Le rôle de l'aire sous la courbe est discuté, mais ma question est précisément quelle inférence pouvons-nous tirer concernant une combinaison x et y particulière qui existe sur la courbe. Par exemple, comment pouvons-nous relier x = 30 et y = 0,02 sur ce graphique. Quelle déclaration pouvons-nous écrire concernant la relation entre 30 et 0,02 ici. Puisque les densités sont pour une valeur unitaire, peut-on dire que 2% des valeurs se produisent entre 29,5 et 30,5? Si tel est le cas, comment interpréter si les valeurs varient de seulement 0 à 1, comme dans le graphique suivant:
Si 100% des valeurs se produisent entre 0 et 1, pourquoi y a-t-il une courbe en dehors de 0 et 1?
Il y a une partie plate ici à x = 0,1 à x = 0,2 où y est égal à 0,8. Il forme un rectangle. Comment savoir quelle proportion de valeurs se produisent entre x = 0,1 et x = 0,2
(PS: Si vous trouvez cette question intéressante / importante, veuillez la voter;)