Fonctions de perte en pourcentage

11

La solution au problème:

min_{m} E [| m - X |]

$\min_{m} \; E[|m-X|]$

est bien connu pour être la médiane de $X$ , mais à quoi ressemble la fonction de perte pour les autres centiles? Ex: le 25e centile de X est la solution pour:

min_{m} E [L (m, X)]

$\min_{m} \; E[ L(m,X) ]$

Qu'est-ce que $L$ dans ce cas?

expected-value loss-functions

— Cam.Davidson.Pilon
source

12

Soit $I$ la fonction indicatrice: elle est égale à $1$ pour les vrais arguments et à $0$ sinon. Choisissez $0\lt\alpha\lt 1$ et définissez

Λ_{α} (x) = α x I (x \geq 0) - (1 - α) x I (x < 0) .

$\Lambda_\alpha(x)=\alpha x\, I(x\ge 0) - (1-\alpha)x\, I(x\lt 0).$

Cette figure représente $\Lambda_{1/5}$ . Il utilise un rapport d'aspect précis pour vous aider à évaluer les pentes, qui sont égales à $-4/5$ sur le côté gauche et $+1/5$ sur la droite. Dans ce cas, les excursions supérieures à $0$ sont fortement pondérées par rapport aux excursions inférieures à $0$ .

Il s'agit d'une fonction naturelle à essayer car elle pondère les valeurs qui dépassent différemment de qui sont inférieures à . Calculons la perte associée et optimisons-la. $x$ $0$ $x$ $0$

Ecrire pour la fonction de distribution de et mettre , calculer $F$ $X$ $L_\alpha(m,x) = \Lambda_\alpha(x-m)$

\begin{aligned} E_{F} (L_{α} (m, X)) & = \int_{R} Λ_{α} (x - m) d F (x) \\ = α \int_{R} I (x \geq m) (x - m) d F (x) - (1 - α) \int_{R} (x - m) I (x < m) d F (x) \\ = α \int_{m}^{\infty} (x - m) d F (x) - (1 - α) \int_{- \infty}^{m} (x - m) d F (x) . \end{aligned}

$\eqalign{ \mathbb{E}_F(L_\alpha(m,X))&=\int_\mathbb{R} \Lambda_\alpha(x-m)dF(x)\\ &=\alpha\int_\mathbb{R} I(x\ge m)(x-m) dF(x) - (1-\alpha)\int_\mathbb{R} (x-m)I(x\lt m) dF(x)\\ &=\alpha\int_m^\infty(x-m)dF(x) - (1-\alpha)\int_{-\infty}^m(x-m) dF(x). }$

Comme varie dans cette illustration avec la distribution normale normale , l'aire pondérée par la probabilité totale de est tracée. (La courbe est le graphique de .) Le graphique de droite pour montre le plus clairement l'effet de la sous-pondération des valeurs positives, car sans cette sous-pondération, le graphique serait être symétrique par rapport à l'origine. Le graphique du milieu montre l'optimum, où la quantité totale d'encre bleue (représentant ) est aussi petite que possible. $m$ $F$ $\Lambda_{1/5}$ $\Lambda_{1/5}(x-m)dF(x)$ $m=0$ $\mathbb{E}_F(L_{1/5}(m,X))\$

Cette fonction est différenciable et ses extrèmes peuvent donc être trouvés en inspectant les points critiques. L'application de la règle des chaînes et du théorème fondamental du calcul pour obtenir la dérivée par rapport à donne $m$

\begin{aligned} \frac{\partial}{\partial m} E_{F} (L_{α} (m, X)) & = α (0 - \int_{m}^{\infty} d F (x)) - (1 - α) (0 - \int_{- \infty}^{m} d F (x)) \\ = F (m) - α . \end{aligned}

$\eqalign{ \frac{\partial}{\partial m}\mathbb{E}_F(L_\alpha(m,X))&=\alpha\left(0-\int_m^\infty dF(x)\right) - (1-\alpha)\left(0 - \int_{-\infty}^m dF(x)\right)\\ &= F(m) - \alpha. }$

Pour les distributions continues cela a toujours une solution qui, par définition, est tout quantile de . Pour les distributions non continues, cela pourrait ne pas avoir de solution mais il y aura au moins un pour lequel pour tous et pour tous : ceci aussi (par définition) est un quantile de . $m$ $\alpha$ $X$ $m$ $F(x)-\alpha\lt 0$ $x\lt m$ $F(x)-\alpha\ge 0$ $x\ge m$ $\alpha$ $X$

Enfin, comme et , il est clair que ni ni ne minimiseront cette perte. Cela épuise l'inspection des points critiques, montrant que correspond à la facture. $\alpha\ne 0$ $\alpha\ne 1$ $m\to-\infty$ $m\to\infty$ $\Lambda_\alpha$

Dans un cas particulier, est la perte présentée dans le question. $\mathbb{E}_F(2L_{1/2}(m,X)) = \mathbb{E}_F\left(\left|m-x\right|\right)$

— whuber
source

J'apprécie l'effort que vous déployez pour montrer que la perte attendue est minimisée par le bon point . Je me demandais comment faire moi-même pour ma propre réponse, mais votre explication est bonne. (+1)

m

$m$

2

Vous avez prouvé que les images valent 1000 mots. Merci @whuber =)

— Cam.Davidson.Pilon

8

Cet article a votre réponse. Pour être précis, La fonction de perte peut être interprétée comme «équilibrant» les différentes régions de masse de probabilité autour de par la soustraction . Pour la médiane, ces régions de masse sont égales: rendant la fonction de perte proportionnelle (dans l'attente, la constante est négligeable) à qui donne la conclusion souhaitée pour la médiane.

L_{0.25} (m, X) = | (X - m) (0.25 - 1 {X > m}) | .

$L_{0.25}(m,X) = \left| \left( X - m \right) \left(0.25 - \mathbf{1}\{ X > m \} \right) \right|.$

0.25

$0.25$

0.25 - 1 {X > m}

$0.25 - \mathbf{1}\{ X > m \}$

L_{0.5} (m, X) = | (X - m) (0.5 - 1 {X > m}) | = | (X - m) \times \pm 0.5 |,

$L_{0.5}(m,X) = \left| \left( X - m \right) \left(0.5 - \mathbf{1}\{ X > m \} \right) \right| = \left| \left( X - m \right) \times \pm 0.5 \right|,$

| X - m |,

$\left| X - m\right|,$

(+1) Bravo! - il n'était pas évident où chercher cet article Wikipedia; il fallait penser à la régression quantile.

— whuber

Merci, @Matthew, c'est une excellente trouvaille. J'aime équilibrer l' interprétation

— Cam.Davidson.Pilon

Je n'arrive toujours pas à comprendre. D'où est-ce que ça vient? Si X est supérieur au quantile, est pondéré 0,75, sinon 0,25? Juste ça?

| (0.25) - 1 X > m) |

$|(0.25)-\mathbb{1}{X>m})|$

(X - m)

$(X-m)$

— IcannotFixThis