Formule d'estimation de régression quantile


10

J'ai vu deux représentations différentes de l'estimateur de régression quantile qui sont

Q(βq)=i:yixiβnqyixiβq+i:yi<xiβn(1q)yixiβq

et

Q(βq)=i=1nρq(yixiβq),ρq(u)=ui(q1(ui<0))

où . Quelqu'un peut-il me dire comment montrer l'équivalence de ces deux expressions? Voici ce que j'ai essayé jusqu'à présent, à partir de la deuxième expression.ui=yixiβq

Q(βq)=i=1nui(q1(ui<0))(yixiβq)=i=1n(yixiβq)(q1(yixiβq<0))(yixiβq)=[i:yixiβn(q(yixiβq))+i:yi<xiβn(q(yixiβq)(yixiβq))](yixiβq)
Mais à partir de là, je suis resté coincé sur la façon de procéder. Veuillez noter que ce n'est pas une question de devoir ou de devoir. Merci beaucoup.

Réponses:


11

Si vous vous souvenez, OLS minimise la somme des résidus carrés tandis que la régression médiane minimise la somme des résidus absolus . L'estimateur des écarts médians ou des écarts les moins absolus (DAL) est un cas particulier de régression quantile dans lequel vous avez . Dans la régression quantile, nous minimisons une somme d'erreurs absolues qui reçoivent des pondérations asymétriques pour la sur-prédiction et pour la sous-prédiction. Vous pouvez commencer à partir de la représentation CONT et l'étendre comme la somme de la fraction des données qui sont pondérées par et compte tenu de leur valeur de , et y travailler comme suit:iui2iuiq=.5(1q)qq(1q)ui

ρq(u)=1(ui>0)qui+1(ui0)(1q)ui=1(yixiβq>0)qyixiβq+1(yixiβq0)(1q)yixiβq
Ceci utilise simplement le fait que et ensuite vous pouvez réécrire la fonction d'indicateur en tant que sommes des observations qui satisfont les conditions des indicateurs . Cela donnera la première expression que vous avez notée pour l'estimateur de régression quantile.ui=yixiβq

=i:yi>xiβqnqyixiβq+i:yixiβqn(1q)yixiβq=qi:yi>xiβqnyixiβq+(1q)i:yixiβqnyixiβq=qi:yi>xiβqn(yixiβq)(1q)i:yixiβqn(yixiβq)=qi:yi>xiβqn(yixiβq)i:yixiβqn(yixiβq)+qi:yixiβqn(yixiβq)=qi=1n(yixiβq)i=1n1(yixiβq0)(yixiβq)=i=1n(q1(ui0))ui

La deuxième ligne extrait les poids des sommations. La troisième ligne supprime les valeurs absolues et les remplace par les valeurs réelles. Par définition est négatif chaque fois que , d'où le changement de signe dans cette ligne. La quatrième ligne se multiplie . Vous réalisez alors que et en remplaçant la sommation du moyen terme à la quatrième ligne par l'indicateur correspondant vous arrivez à la cinquième ligne. Factorisation puis remplacement deyixiβqyi<xiβq(1q)

qi:yi>xiβqn(yixiβq)+qi:yixiβqn(yixiβq)=i=1n(yixiβq)
yixiβqui
Cela montre comment les deux expressions sont équivalentes.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.