Vous ne spécifiez pas que vous parlez de variables aléatoires continues, mais je suppose, puisque vous mentionnez KDE, que vous avez l'intention de le faire.
Deux autres méthodes pour ajuster les densités lisses:
1) estimation de la densité log-spline. Ici, une courbe spline est ajustée à la densité logarithmique.
Un exemple de papier:
Kooperberg et Stone (1991),
«A study of logspline densité estimation»,
Computational Statistics & Data Analysis , 12 , 327-347
Kooperberg fournit un lien vers un pdf de son article ici , sous "1991".
Si vous utilisez R, il existe un package pour cela. Un exemple d'un ajustement généré par celui-ci est ici . Vous trouverez ci-dessous un histogramme des journaux de l'ensemble de données et des reproductions des estimations de la courbe du journal et de la densité du noyau à partir de la réponse:
Estimation de la densité du logspline:
Estimation de la densité du noyau:
2) Modèles à mélange fini . Ici, une famille de distributions commode est choisie (dans de nombreux cas, la normale), et la densité est supposée être un mélange de plusieurs membres différents de cette famille. Notez que les estimations de densité de noyau peuvent être considérées comme un tel mélange (avec un noyau gaussien, elles sont un mélange de Gaussiennes).
Plus généralement, ceux-ci peuvent être ajustés via ML, ou l'algorithme EM, ou dans certains cas via l'appariement des moments, bien que dans des circonstances particulières, d'autres approches puissent être envisageables.
(Il existe une pléthore de packages R qui font diverses formes de modélisation de mélange.)
Ajouté en édition:
3) Histogrammes décalés moyens
(qui ne sont pas littéralement lisses, mais peut-être assez lisses pour vos critères non déclarés):
Imaginez que vous calculez une séquence d'histogrammes à une certaine largeur de binaire fixe ( ), à travers une origine de binaire qui se décale de pour un entier chaque fois, puis en moyenne. Cela ressemble à première vue à un histogramme fait à la largeur de bande , mais est beaucoup plus fluide.b / k k b / kbb/kkb/k
Par exemple, calculez 4 histogrammes chacun à la largeur de bande 1, mais décalés de + 0, + 0,25, + 0,5, + 0,75, puis faites la moyenne des hauteurs à tout donné . Vous vous retrouvez avec quelque chose comme ça:x
Diagramme tiré de cette réponse . Comme je l'ai dit, si vous allez à ce niveau d'effort, vous feriez aussi bien d'estimer la densité du noyau.