Je lis PRML et je ne comprends pas l'image. Pourriez-vous s'il vous plaît donner quelques conseils pour comprendre l'image et pourquoi le MLE de la variance dans une distribution gaussienne est biaisé?
formule 1.55: formule 1.56 σ 2 M L E =1
Je lis PRML et je ne comprends pas l'image. Pourriez-vous s'il vous plaît donner quelques conseils pour comprendre l'image et pourquoi le MLE de la variance dans une distribution gaussienne est biaisé?
formule 1.55: formule 1.56 σ 2 M L E =1
Réponses:
Intuition
Le biais vient "(pas du tout d'un terme technique) du fait que est biaisé pour . La question naturelle est, "eh bien, quelle est l'intuition pour laquelle est biaisé pour "? L'intuition est que dans une moyenne d'échantillon non quadratique, nous manquons parfois la vraie valeur en surestimant et parfois en sous-estimant. Mais, sans quadrature, la tendance à surestimer et à sous-estimer s'annule mutuellement. Cependant, lorsque nous quadrillons la tendance à sous-estimer (manquer la vraie valeur deμ 2 E [ ˉ x 2 ] μ 2 μ ˉ x μpar un nombre négatif) devient également carré et devient ainsi positif. Ainsi, il n'annule plus et il y a une légère tendance à surestimer.
Si l'intuition derrière pourquoi est biaisé pour n'est toujours pas claire, essayez de comprendre l'intuition derrière l'inégalité de Jensen (bonne explication intuitive ici ) et appliquez-la à .μ 2 E [ x 2 ]
Prouvons que le MLE de variance pour un échantillon iid est biaisé. Ensuite, nous vérifierons analytiquement notre intuition.
Preuve
Soit .
Nous voulons montrer .
En utilisant le fait que et ,
Avec la dernière étape qui suit car est égal sur raison de la même distribution.
Maintenant, rappelez-vous la définition de la variance qui dit . De là, nous obtenons ce qui suit
Notez que nous avons correctement mis au carré la constante en la retirant de . Portez une attention particulière à cela!
ce qui n'est bien sûr pas égal à .
Vérifier analytiquement notre intuition
Nous pouvons quelque peu vérifier l'intuition en supposant que nous connaissons la valeur de et en la connectant à la preuve ci-dessus. Puisque nous connaissons maintenant , nous n'avons plus besoin d'estimer et donc nous ne le surestimons jamais avec . Voyons que cela "supprime" le biais dans .
Soit .
A partir de la preuve ci-dessus, reprenons remplaçant par la vraie valeur .ˉ x μ
ce qui est impartial!