À la page 180 de Statistiques robustes: l'approche basée sur les fonctions d'influence, on trouve la question suivante:
- 16: Montrer que pour les estimateurs invariants de localisation toujours . Trouvez la borne supérieure correspondante sur le point de rupture de l'échantillon fini , à la fois dans le cas où est impair ou est pair.
La deuxième partie (après la période) est en fait triviale (étant donné la première) mais je ne trouve pas de moyen de prouver la première partie (phrase) de la question.
Dans la section du livre relative à cette question, on trouve (p98):
Définition 2: Le point de rupture d'échantillon fini d'un estimateur à l'échantillon est donné par:
où l'échantillon est obtenu en remplaçant points de données par des valeurs arbitraires
La définition formelle de elle-même s'étend sur presque une page, mais peut être considérée comme Bien qu'elle ne soit pas définie explicitement, une peut deviner que l'emplacement-invariant signifie que doit satisfaire
Je (essaie de) répondre à la question de whuber dans le commentaire ci-dessous. Le livre définit l'estimateur fait plusieurs pages, à partir de la p82, j'essaie de reproduire les parties principales (je pense qu'il répondra à la question de whuber):
Supposons que nous ayons des observations unidimensionnelles qui sont indépendantes et identiquement distribuées (iid). Les observations appartiennent à un espace échantillon , qui est un sous-ensemble de la ligne réelle (souvent simplement égal à lui-même, donc les observations peuvent prendre n'importe quelle valeur ). Un modèle paramétrique consiste en une famille de distributions de probabilités , sur l'espace échantillon, où le paramètre inconnu appartient à un espace paramétrique
...
Nous identifions l'échantillon avec sa distribution empirique , en ignorant la séquence des observations (comme cela se fait presque toujours). Formellement, , est donnée par où , est la masse du point 1 dans . En tant qu'estimateurs de , nous considérons les statistiques à valeur réelle . Dans un sens plus large, un estimateur peut être considéré comme une séquence de statistiques , une pour chaque taille d'échantillon possible . Idéalement, les observations sont iid selon un membre du modèle paramétrique , mais la classe de toutes les distributions de probabilités possibles sur est beaucoup plus grande.
Nous considérons des estimateurs qui sont fonctionnels [c'est-à-dire pour tout et ] ou qui peuvent être remplacés asymptotiquement par des fonctionnels. Cela signifie que nous supposons qu'il existe un fonctionnel [où le domaine de est l'ensemble de toutes les distributions pour laquelle est défini] tel que en probabilité lorsque les observations sont iid selon la vraie distribution dans . On dit que
est la valeur asymptotique de à .
...
Dans ce chapitre, nous supposons toujours que les fonctionnelles étudiées sont cohérentes avec Fisher (Kallianpur et Rao, 1955): ce qui signifie qu'à le modèle l'estimateur mesure asymptotiquement la bonne quantité. La notion de cohérence de Fisher est plus appropriée et élégante pour les fonctionnelles que la cohérence habituelle ou l'impartialité asymptotique.