«L'estimation de la densité du noyau» est une convolution de quoi?

J'essaie de mieux comprendre l'estimation de la densité du noyau.

En utilisant la définition de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

$\hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big)$

Prenons pour être une fonction rectangulaire qui donne si est compris entre et et sinon, et (taille de fenêtre) pour être 1. $K()$ $1$ $x$ $-0.5$ $0.5$ $0$ $h$

Je comprends que la densité est une convolution de deux fonctions, mais je ne suis pas sûr de savoir comment définir ces deux fonctions. L'un d'eux devrait (probablement) être une fonction des données qui, pour chaque point de R, nous indique combien de points de données nous avons à cet endroit (principalement ). Et l'autre fonction devrait probablement être une modification de la fonction du noyau, combinée avec la taille de la fenêtre. Mais je ne sais pas comment le définir. $0$

Aucune suggestion?

Ci-dessous est un exemple de code R qui (je soupçonne) reproduit les paramètres que j'ai définis ci-dessus (avec un mélange de deux Gaussiens et ), sur lequel j'espère voir une "preuve" que les fonctions à alambiquer sont comme nous le suspectons . $n=100$

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

entrez la description de l'image ici

r kernel-smoothing convolution

— Tal Galili
source

Votre tapis en bas donne une intuition approximative. Imaginez que chaque valeur

soit un pic avec un poids associé

. Maintenant, étalez chaque pic en utilisant la forme et la largeur de votre noyau, de sorte que le pic soit transformé pour prendre la même forme et la même largeur, avec une hauteur telle que la zone ci-dessous soit

. Ajoutez les résultats et vous obtenez une estimation de la densité du noyau.

x_{i}

$x_i$

i = 1

$i = 1$

n

$n$

1 / n

$1/n$

1 / n

$1/n$

— Nick Cox

Salut Nick, merci pour le commentaire. Jusqu'ici dans l'intuition que j'ai déjà, c'est le transformer formellement en la forme de la convolution que j'étais curieux de voir :) (j'ai hâte de passer par la réponse de Whuber!)

— Tal Galili

Correspond à tout lot de données $X = (x_1, x_2, \ldots, x_n)$ est sa «fonction de densité empirique»

f_{X} (x) = \frac{1}{n} \sum_{i = 1}^{n} δ (x - x_{i}) .

$f_X(x) = \frac{1}{n}\sum_{i=1}^{n} \delta(x-x_i).$

Ici, $\delta$ est une "fonction généralisée". Malgré ce nom, ce n'est pas du tout une fonction: c'est un nouvel objet mathématique qui ne peut être utilisé que dans les intégrales. Sa propriété déterminante est que pour toute fonction $g$ de support compact continu dans un voisinage de $0$ ,

\int_{R} δ (x) g (x) d x = g (0) .

$\int_{\mathbb{R}}\delta(x) g(x) dx = g(0).$

(Les noms pour $\delta$ incluent la mesure "atomique" ou "ponctuelle" et la " fonction delta de Dirac " . Dans le calcul suivant, ce concept est étendu pour inclure les fonctions $g$ qui sont continues d'un seul côté.)

La justification de cette caractérisation de $f_X$ est l'observation que

\begin{aligned} \int_{- \infty}^{x} f_{X} (y) d y & = \int_{- \infty}^{x} \frac{1}{n} \sum_{i = 1}^{n} δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} \int_{- \infty}^{x} δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} \int_{R} I (y \leq x) δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} I (x_{i} \leq x) \\ = F_{X} (x) \end{aligned}

$\eqalign{ \int_{-\infty}^{x} f_X(y) dy &= \int_{-\infty}^{x} \frac{1}{n}\sum_{i=1}^{n} \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} \int_{-\infty}^{x} \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} \int_{\mathbb{R}} I(y\le x) \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} I(x_i \le x) \\ &= F_X(x) }$

$F_X$ $I$ $1$ $0$ $\mathbb{R}$ $I$ $X$

$f_X(x)$ $k$

\begin{aligned} (f_{X} * k) (x) & = \int_{R} f_{X} (x - y) k (y) d y \\ = \int_{R} \frac{1}{n} \sum_{i = 1}^{n} δ (x - y - x_{i}) k (y) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} \int_{R} δ (x - y - x_{i}) k (y) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} k (x_{i} - x) . \end{aligned}

$\eqalign{ (f_X * k)(x) &= \int_{\mathbb{R}} f_X(x - y) k(y) dy \\ &=\int_{\mathbb{R}} \frac{1}{n}\sum_{i=1}^{n} \delta(x-y-x_i) k(y) dy \\ &= \frac{1}{n}\sum_{i=1}^{n}\int_{\mathbb{R}} \delta(x-y-x_i) k(y) dy \\ &=\frac{1}{n}\sum_{i=1}^{n} k(x_i-x). }$

$k(x) = K_h(-x)$ $K_h(x)$

— whuber
source

La situation en deux dimensions est expliquée (en termes plus familiers) et illustrée sur le site SIG à gis.stackexchange.com/questions/14374/… .

— whuber

Cher Whuber, je viens de lire et de lire votre réponse avec plaisir! Merci beaucoup pour l'explication et les détails, vos réponses (celle-ci et vos autres en général) sont vraiment inspirantes. Bien à vous, Tal

— Tal Galili

δ

$\delta$

g,

$g,$

x_{i}

$x_i$

g (x_{i}) .

$g(x_i).$

@whuber Merci. La phrase La fonction généralisée δ n'est pas du tout une fonction: c'est un nouvel objet mathématique qui ne peut être utilisé qu'au sein d'intégrales. rendu plus clair. sur le point comme toujours. ;)

— Jan Vainer

@Jan Merci pour votre aide: j'ai intégré cette idée dans cette réponse.

— whuber