J'essaie de comprendre comment fonctionnent les fonctions d'influence. Quelqu'un pourrait-il expliquer dans le contexte d'une simple régression OLS
où je veux la fonction d'influence pour .
J'essaie de comprendre comment fonctionnent les fonctions d'influence. Quelqu'un pourrait-il expliquer dans le contexte d'une simple régression OLS
où je veux la fonction d'influence pour .
Réponses:
Les fonctions d'influence sont essentiellement un outil analytique qui peut être utilisé pour évaluer l'effet (ou "influence") de la suppression d'une observation sur la valeur d'une statistique sans avoir à recalculer cette statistique . Ils peuvent également être utilisés pour créer des estimations de variance asymptotique. Si l'influence est égale à variance asymptotique est .I 2
La façon dont je comprends les fonctions d'influence est la suivante. Vous avez une sorte de CDF théorique, noté . Pour les OLS simples, vous avez
Notez que donc nous obtenons: S [ F ( i ) ( z , ζ ) ] ≈ S [ F ( z ) ] + ζ [ ∂ S [ F ( i ) ( z , ζ ) ]
La dérivée partielle est appelée ici la fonction d'influence. Cela représente donc une correction approximative de "premier ordre" à apporter à une statistique en raison de la suppression de la "ième" observation. Notez que dans la régression, le reste ne va pas à zéro de façon asymétrique, de sorte qu'il s'agit d'une approximation des changements que vous pouvez réellement obtenir. Maintenant écrivez comme:
Ainsi, le bêta est fonction de deux statistiques: la variance de X et la covariance entre X et Y. Ces deux statistiques ont des représentations en termes de CDF comme:
et v a r ( X ) = ∫ ( X - μ x ( F ) ) 2 d F où μ x = ∫ x d F
Nous pouvons maintenant utiliser la série Taylor:
Simplifier cela donne:
Voici une façon super générale de parler des fonctions d'influence d'une régression. Je vais d'abord aborder une façon de présenter les fonctions d'influence:
À partir de cela, nous pouvons définir la fonction d'influence assez facilement:
L'estimation OLS est une solution au problème:
Prendre des conditions de première commande:
Puisque la fonction d'influence n'est qu'un dérivé de Gateaux, nous pouvons maintenant dire:
L'échantillon fini de cette fonction d'influence est:
En général, je trouve ce cadre (travailler avec des fonctions d'influence comme dérivées de Gateaux) plus facile à gérer.