Supposons que j'ai une variable comme X
avec une distribution inconnue. Dans Mathematica, en utilisant la SmoothKernelDensity
fonction, nous pouvons avoir une fonction de densité estimée. Cette fonction de densité estimée peut être utilisée avec la PDF
fonction pour calculer la fonction de densité de probabilité d'une valeur comme X
sous la forme de PDF[density,X]
supposer que la "densité" est le résultat de SmoothKernelDensity
. Ce serait bien s'il y avait une telle fonctionnalité dans R. C'est ainsi que cela fonctionne dans Mathematica
http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html
À titre d'exemple (basé sur les fonctions Mathematica):
data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1)
density= SmoothKernelDistribution[data]; #estimated density
PDF[density, 2.345] returns 0.0588784
Vous trouverez ici plus d'informations sur le PDF:
http://reference.wolfram.com/mathematica/ref/PDF.html
Je sais que je peux tracer sa fonction de densité en utilisant density(X)
dans R et en utilisant ecdf(X)
je peux obtenir sa fonction de distribution cumulative empirique.Est-il possible de faire la même chose en R sur la base de ce que j'ai décrit à propos de Mathematica?
Toute aide et idée est appréciée.
ecdf(X)
me donne le centile équivalent de 7,5 mais ce n'est pas ce que je recherche.
density(x)
donne une estimation du pdf, comme vous l'avez déjà noté, mais sa pertinence dépend de l'objectif pour lequel vous voulez avoir la densité. Notez, par exemple, que la variance est biaisée (en effectuant la convolution, vous ajoutez la variance du noyau à la variance des données, elle-même une estimation non biaisée) - ces compromis biais-variance sont omniprésents. Il existe d'autres alternatives, telles que l'estimation de la densité log-spline, par exemple - mais encore une fois, sa pertinence dépend en partie de ce que vous voulez en faire.