Régression linéaire avec bruit de grenaille


8

Je cherche la bonne terminologie statistique pour décrire le problème suivant.

Je veux caractériser un appareil électronique qui a une réponse linéaire

Y=β0+β1X+ϵ

ϵN(0,σro2)est un terme dû au bruit de lecture de l'appareil. Afin de déterminerβ0,β1,σro2 Je mesurerais une série de réponses {Xi,Yi}et appliquez la boîte à outils de régression linéaire standard. Mais je ne sais pasXisont exactement, car j'utilise une source qui est affectée par le bruit de tir. C'est-à-dire que je sais que si je règle le cadran de la source sur une certaine valeurJi puis XiN(μ,μ) (un gaussien avec une moyenne μ et variance μ).

Cela ressemble à un modèle d'erreurs dans les variables de régression linéaire ( http://en.wikipedia.org/wiki/Errors-in-variables_models ), sans le fait que pour caractériser mon appareil sur toute sa plage d'entrée , pendant les mesures, je dois changer la valeur deJi, et maintenant la variance du Xi n'est pas fixe, mais cela dépend Xi (par J_i), bien qu'en raison du bruit de tir si Xi=Xj cela ne signifie pas que la variance de Xi est la même que la variance de Xj.

Comment s'appelle ce modèle et y a-t-il des articles où je peux découvrir qu'un tel problème est abordé? Ou est-ce que je formule mal?


Var (Xi) = μ = E (Xi)> 0. Si cela était corrigé, ce serait une erreur dans le modèle de variables avec un rapport de variance σ2 ro/ μ. Ce n'est pas parce que μ change avec le Xi. J'ai vu des modèles avec variance non constante en Y et des modèles avec des erreurs dans les variables mais pas ce type de modèle qui a des erreurs dans les variables avec une variance non constante. Lorsque la variance dans Y n'est pas constante, il est parfois possible de modéliser la variance en fonction de la valeur de la covariable x. Peut-être que quelque chose comme ça pourrait être fait pour l'erreur dans X.
Michael R. Chernick

Réponses:


3

Le modèle de probabilité pour un tel bruit de tir est

XPoisson(μ),Y|XNormal(β0+β1X,σ2).

Une bonne estimation de μ est la moyenne de X et une bonne estimation de (β0,β1) est fourni par les moindres carrés ordinaires, car les valeurs de Y sont supposés indépendants, identiques et normaux.

L'estimation de σ2 donné par OLS est inapproprié ici, cependant, en raison du caractère aléatoire de X. L'estimation du maximum de vraisemblance est

s2=Sxy22SxSySxy+Sxx(Sy2Syy)+Sx2SyySx2Sxx.

Dans cette notation, Sx est la moyenne X valeur, Sxy est la moyenne des produits de la X et Y valeurs, etc.

Nous pouvons nous attendre à ce que les erreurs d'estimation standard dans les deux approches (OLS, qui n'est pas tout à fait raison, et MLE comme décrit ici) diffèrent . Il existe différentes manières d'obtenir les erreurs standard ML: consultez une référence. Parce que la probabilité logarithmique est relativement simple (en particulier lorsque le Poisson(μ) la distribution est approximée par un Normal(μ,μ) distribution pour les grands μ), ces erreurs standard peuvent être calculées sous forme fermée si l'on le souhaite.


Par exemple, j'ai généré12 X valeurs d'un Poisson(100) Distribution:

94,99,106,87,91,101,90,102,93,110,97,123

Ensuite, en définissant β0=3, β1=1/2, et σ=1, J'ai généré 12 correspondant Y valeurs:

47.4662,53.5622,54.6656,45.3592,49.0347,53.8803,48.3437,54.2255,48.4506,58.6761,50.7423,63.9922

La moyenne X la valeur est égale 99.4167, l'estimation de μ. Les résultats OLS (identiques aux MLE des coefficients) estimentβ0 comme 1.24 et β1 comme 0.514271. Il n'est pas surprenant de l'estimation de l'interception,β0, s'écarte de sa vraie valeur de 3, car ces Xles valeurs restent loin de l'origine. L'estimation de la pente,β1, est proche de la valeur réelle de 0.5.

L'estimation OLS de σ2est cependant 0.715, inférieur à la valeur réelle de 1. Le MLE deσ2 fonctionne à 0.999351. (C'est un accident que les deux estimations soient faibles et que le MLE soit supérieur à l'estimation de l'OLS.)

Figure

La droite correspond à la fois à l'ajustement OLS et à l'estimation du maximum de vraisemblance pour le modèle de probabilité conjoint Poisson-Normal.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.