Expliquer le graphique de densité du noyau


8

J'exécute la simulation sur un modèle linéaire. J'obtiens 1000 résultats et les résultats sont mis dans un graphique de densité. Je comprends que le xaxis est la variable dépendante et que les yaxis représentent la densité du noyau. Yaxis est en nombres décimaux comme de 0 à 0,15. Comment expliquer cela aux autres utilisateurs? Il y a 15% de chances que les valeurs simulées se situent entre x1 et x2?

Voici ma sortie de simulation:

summary(s)

Model:  ls 
Number of simulations:  1000 

Values of X
  (Intercept)  Volume
1           1 1699992
attr(,"assign")
[1] 0 1

Expected Values: E(Y|X) 
    mean    sd    50% 2.5%  97.5%
1 12.305 2.638 12.231 7.03 17.512

entrez la description de l'image ici


Comment expliqueriez-vous la hauteur d'une autre densité? (Si c'est la partie que vous ne connaissez pas, vous semblez poser la mauvaise question - vous avez besoin de la plus générale; si vous savez comment expliquer ce qu'est une densité, l'explication est la même)
Glen_b -Reinstate Monica

Réponses:


14

Vous pouvez considérer l'estimation de la densité du noyau comme un histogramme lissé. Les histogrammes sont limités par le fait qu'ils sont intrinsèquement discrets (via des bacs) et sont donc plus appropriés pour afficher des données sur des variables discrètes et peuvent être très sensibles à la taille des bacs.

Ce que vous faites réellement avec l'estimation de densité de noyau est d'estimer la fonction de densité de probabilité. Cela rend l'interprétation simple. L'aire sous la courbe est donc 1, et la probabilité qu'une valeur soit comprise entre x1 et x2 est l'aire sous la courbe entre ces deux points.

Le nombre de valeurs Y déterminera la "résolution" de la courbe, donc si vous supposez une ligne droite entre tous les deux points Y adjacents, vous pouvez calculer une approximation de la zone sous la courbe entre ces deux points.

Pour déterminer la probabilité d'une valeur :xP(xa<x<xb)

P(xa<x<xb)=ya+..+yb

Le résultat sera d'autant plus précis que vous aurez de valeurs .y


ok, en regardant le tableau ci-dessus, que signifie 0,10? Je sais ce que sont les abscisses. Comment puis-je dire que c'est une bonne estimation?
user1471980

en regardant le graphique ci-dessus y-axix c (0,00, 0,10) et besoin de calculer la probabilité de rotation de l'axe x entre 5 et 20, (20-5) * (0,10 + 0,00) /2=0,75. Il y a 75% de chances que les valeurs de la simulation soient comprises entre 5 et 20. Est-ce vrai?
user1471980

Je pense que je comprends cela. Mais je dois juste m'en assurer. y-axix c (0, 0,05, 0,10, 0,15), xaxis c (5,10,15,20), pour calculer le cumul: (20-5) * (0,0 + 0,05 + 0,1 + 0,15) /4=1,125 (cette valeur est supérieure à 1, n'est-ce pas?)
user1471980

@ user1471980 J'ai mis à jour ma réponse, je supprime mes commentaires pour éviter toute confusion.
Bitwise

1

Depuis aucune réputation à commenter le post ci-dessus ...

L'expression , ne semble pas correcte. Prenons par exemple la fonction de densité uniforme sur l'intervalle [0, 1.0], puis selon ce qui précède et en utilisant uniquement la probabilité de n'importe quel intervalle serait de 2. Ce que je pense que l'affiche essayait de faire référence était la règle trapézoïdale .P(xa<x<xb)=ya+...+ybya,yb

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.