Comment montrer qu'une statistique suffisante n'est PAS minimale suffisante?

Mon problème de devoirs est de donner un contre-exemple où une certaine statistique n'est en général pas suffisamment minimale. Quels que soient les détails de la recherche d'un contre-exemple particulier pour cette statistique particulière, cela me pose la question suivante:

Question: Comment peut-on formuler la condition de ne pas être une statistique suffisante minimale de manière à prouver qu'une statistique suffisante satisfait à la condition?

Travail à ce jour: La définition de statistique minimale suffisante dans mon manuel (Keener, Theoretical Statistics: Topics for a Core Course ) est la suivante:

Une statistique est minimale suffisante si est suffisante et, pour chaque statistique suffisante il existe une fonction telle que ae . $T$ $T$ $\tilde{T}$ $f$ $T = f(\tilde{T})$ $\mathcal{P}$

Notez que (ae ) signifie que l'ensemble où l'égalité échoue est un ensemble nul pour chaque distribution de probabilité dans le modèle statistique , . $\mathcal{P}$ $P$ $\mathcal{P}$ $P \in \mathcal{P}$

En essayant de nier cela, j'arrive à:

Une statistique n'est pas minimale suffisante si au moins l'une des hypothèses suivantes:
1. $T$ n'est pas suffisant.
2. Il existe au moins une statistique suffisante pour laquelle il n'y a pas de fonction telle que ae . $\tilde{T}$ $f$ $T = f(\tilde{T})$ $\mathcal{P}$

Donc, si une statistique est suffisante, il semble qu'il serait extrêmement difficile de montrer qu'elle n'est pas suffisante minimale, même si elle n'est pas suffisante minimale. (Parce qu'il faudrait montrer 2. au lieu de 1., car 1. est faux - mais 2. serait très difficile à montrer parce que, même si l'on a une statistique de contre-exemple à l'esprit, on a toujours pour montrer la non-existence d' une fonction avec cette propriété. Et la non-existence est souvent difficile à montrer.) $\tilde{T}$

Mon manuel ne donne aucune condition équivalente (c'est-à-dire nécessaire et suffisante) pour qu'une statistique soit une statistique minimale suffisante. Il ne donne même aucune autre condition nécessaire pour qu'une statistique soit une statistique minimale suffisante (en plus d'être une statistique suffisante).

Par conséquent, pour mon problème de devoirs, si je ne peux pas montrer que la statistique n'est pas suffisante (parce qu'elle l'est), alors comment pourrais-je jamais montrer qu'elle n'est pas minimale suffisante?

self-study mathematical-statistics sufficient-statistics

— Chill2Macht
source

Avez-vous envisagé de commencer avec une statistique minimale suffisante, puis de l'agrandir pour inclure davantage de composants?

— whuber

En mathématiques en général, on prouve souvent la non-existence de quelque chose en supposant qu'il existe et en l'utilisant pour trouver une contraction.

— Kodiologist

Une statistique est une fonction vectorielle des données. Il a des composants. Par exemple, une statistique minimale suffisante pour la famille normale de distributions est le vecteur à deux vecteurs composé de la moyenne de l'échantillon et de la variance de l'échantillon. Adjoindre plus de composants - ajoutez l'exemple d'asymétrie et de kurtosis - vous donne une statistique avec quatre composants. Mon indice a simplement énoncé l'évidence: cette nouvelle statistique est évidemment suffisante, car ses deux premières composantes sont déjà suffisantes. Mais est-ce un minimum suffisant?

— whuber

Je ne vois pas en quoi ces observations sur les bijections ou les homéomorphismes pourraient être pertinentes. Utilisez-vous une définition inhabituelle de «statistique» ou «suffisante»?

— whuber

Vous semblez utiliser une sorte de définition non conventionnelle de la suffisance. Dans mon exemple, tout ce qui compte, c'est que les nouvelles statistiques soient de véritables statistiques - des fonctions mesurables des données. La carte de

R^{4}

$\mathbb{R}^4$ à

R^{2}

$\mathbb{R}^2$ (qui récupère les deux statistiques originales, la minimale suffisante) est mesurable (en effet, différenciable). C'est tout ce que vous devez vérifier.

— whuber

Réponses:

Comme vous l'avez dit:

S'il existe $x1,x2∈X$ tel que $f(x1)=f(x2)$ mais $g(x1)≠g(x2)$ , puis $g$ ne peut pas être écrit en fonction de $f$ , c'est-à-dire qu'il n'existe aucune fonction $h$ avec $g=h∘f$ .

Ainsi, par exemple, dans le cas où $X_1, ...., X_n$ sont des variables aléatoires de Bernoulli indépendantes. Nous pouvons prouver que $(x_1, ...., x_n)$ n'est pas minimalement suffisant en montrant qu'il n'est pas fonction de $\sum x_i$ . Cela est évident, car la fonction doit mapper $1$ aux deux $(1,0,0...,0,0,0)$ et $(0,0,0...,0,0,1)$ .

— Euclide
source

J'ai pensé à ce problème plus récemment, et voici ce que j'ai trouvé.

Laisser $\Omega$ être un espace de probabilité, puis une variable aléatoire $X$ est une fonction mesurable $X: \Omega \to \mathcal{X}$ , où $\mathcal{X}$ est un espace mesurable ( $\mathcal{X}$ a désigné $\sigma$ -algèbre, et $X$ est mesurable par rapport à cette $\sigma$ -algèbre et $\sigma$ -algèbre sur $\Omega$ ). La répartition des $X$ est juste la mesure de retrait $\mathcal{X}$ , c'est à dire $\mathbb{P}_{\mathcal{X}}(A) = \mathbb{P}_{\Omega}(X^{-1}(A))$ . Ensuite, une statistique de $X$ est une fonction mesurable * $f: \mathcal{X} \to \mathcal{Y}$ , où $\mathcal{Y}$ est un autre espace mesurable arbitraire.

Étant donné deux statistiques $f: \mathcal{X} \to \mathcal{Y}$ , $g: \mathcal{X} \to \mathcal{Z}$ , qu'est-ce que cela signifie pour " $g$ être fonction de $f$ "?

Pour autant que je sache, cela semble signifier qu'il existe une fonction mesurable ** $h: \mathcal{Y} \to \mathcal{Z}$ tel que $g = h \circ f$ , c'est-à-dire que $g$ peut être pris en compte par $f$ .

(En d'autres termes, " $g$ doit être bien défini en fonction de $f(\mathcal{X}) \subseteq \mathcal{Y}$ ".)

Alors, quand un tel affacturage est-il possible? Pensons en termes de relations d'équivalence. Plus précisément, définissez la relation d'équivalence $\sim_f$ sur $\mathcal{X}$ par $x_1 \sim_f x_2 \iff f(x_1) = f(x_2)$ , de même, définir la relation d'équivalence $\sim_g$ sur $\mathcal{X}$ par $x_1 \sim_g x_2 \iff g(x_1) = g(x_2)$ .

Ensuite, pour $g$ être factorisable par $f$ , les relations d'équivalence $\sim_f$ et $\sim_g$ doivent être compatibles les uns avec les autres, dans le sens *** que pour tout $x_1, x_2 \in \mathcal{X}$ , $x_1 \sim_f x_2 \implies x_1 \sim_g x_2$ , c'est à dire $g$ ne peut pas prendre deux éléments équivalents sous $f$ et les mapper à des valeurs qui ne sont pas équivalentes sous $g$ , c'est à dire " $g$ ne peut pas annuler la réduction d'informations précédemment effectuée par $f$ ".

En d'autres termes, $g$ doit être bien défini en fonction de $\mathcal{X}/\sim_f \cong f(\mathcal{X})$ c'est-à-dire qu'il doit exister une fonction $\tilde{g}: \mathcal{X}/\sim_f \to \mathcal{Z}$ tel que $g = \tilde{g} \circ \pi_f$ , où $\pi_f$ est la projection canonique $\mathcal{X} \to \mathcal{X}/\sim_f$ . (Pour ceux qui ne sont pas à l'aise avec le non-sens abstrait, $\pi_f$ est essentiellement $f$ , et $\tilde{g}$ est essentiellement $h$ . La formulation ci-dessus rend plus claires les analogies avec d'autres situations.)

En termes les plus simples possibles, $g$ peut être écrit en fonction de $f$ si et seulement si, pour tout $x_1, x_2 \in \mathcal{X}$ , $f(x_1) = f(x_2) \implies g(x_1) = g(x_2)$ .

Par exemple, prenez $\mathcal{X} = \mathcal{Y} = \mathcal{Z} = \mathbb{R}$ et $X$ une variable aléatoire arbitraire à valeur réelle, puis $g: x \mapsto x^2$ peut être écrit en fonction de $f: x \mapsto x$ , mais pas l'inverse, car $x_1 = x_2 \implies x_1^2 = x_2^2$ , mais $1^2 = (-1)^2$ mais $1 \not= -1$ .

En particulier, supposons que chaque classe d'équivalence sous $\sim_f$ est un singleton (c.-à-d. $f$ est injective ). alors $g$ peut toujours être écrit en fonction de $f$ , depuis $\mathcal{X}/\sim_f \cong \mathcal{X}$ , c'est à dire $f(x_1) = f(x_2) \implies x_1 = x_2$ signifie que $x_1 = x_2 \iff f(x_1) = f(x_2)$ (en général, pour les injections non nécessairement $f$ , une seule direction tient), donc notre condition devient $x_1 = x_2 \implies g(x_1) = g(x_2)$ , qui est trivialement satisfait pour tout $g: \mathcal{X} \to \mathcal{Z}$ . (Définir $h$ , il peut faire tout ce qu'il veut sur $\mathcal{Y} \setminus f(\mathcal{X})$ tant qu'il est mesurable, puis pour tout $y \in f(\mathcal{X})$ , c'est-à-dire tels que $y = f(x)$ pour certains $x \in \mathcal{X}$ , définir $h$ être $h: y = f(x) \mapsto g(x)$ . Ceci est bien défini lorsque $f$ est injectif parce qu'il y a un unique $x \in \mathcal{X}$ tel que $f(x) = y$ . Plus généralement, cela n'est défini que lorsque, quel que soit $x$ nous choisissons $f^{-1}(y)$ , $g(x)$ est toujours la même valeur, à savoir $f(x_1)=f(x_2)\ (=y) \implies g(x_1)=g(x_2)$ .)

De plus, en regardant le théorème 3.11 dans Keener, sa déclaration est un peu maladroite, mais en pensant dans les termes ci-dessus, je pense qu'elle peut être réécrite comme:

Supposer $T$ est une statistique suffisante ****. Une condition suffisante pour $T$ être minimal suffisant est qu'il peut être écrit en fonction du rapport de vraisemblance.

À partir de cela, il devient immédiatement clair que le rapport de vraisemblance doit lui-même être minimal suffisant.

Cela conduit également à la conclusion que:

S'il existe $x_1, x_2 \in \mathcal{X}$ tel que $f(x_1)=f(x_2)$ mais $g(x_1) \not= g(x_2)$ , puis $g$ ne peut pas être écrit en fonction de $f$ , c'est-à-dire qu'il n'existe aucune fonction $h$ avec $g = h \circ f$ .

Ainsi, la condition n'est pas aussi difficile à montrer que je le pensais.

* Keener n'aborde pas la question de savoir si une statistique doit être une fonction mesurable ou simplement arbitraire ou non. Cependant, je suis assez sûr qu'une statistique doit être une fonction mesurable, car sinon nous ne pourrions pas définir une distribution pour elle , c'est-à-dire une mesure de retrait.

**Si $h$ n'étaient pas mesurables, nous aurions une contradiction car les deux $f$ et $g$ sont mesurables et la composition des fonctions mesurables est à nouveau mesurable. Tout au moins, $h$ doit être mesurable limité à $f(\mathcal{X}) \subseteq \mathcal{Y}$ , bien que je pense que cela signifierait dans la plupart des cas raisonnables que $h$ devrait se mettre d'accord sur $f(\mathcal{X})$ avec une fonction mesurable sur tous $\mathcal{Y}$ (prendre $h|_{f(\mathcal{X})}$ sur $f(\mathcal{X})$ et par exemple $z$ sur $Y \setminus f(\mathcal{X})$ s'il existe un point mesurable $z \in \mathcal{Z}$ , notez que les deux $f(\mathcal{X})$ et $Y \setminus f(\mathcal{X})$ devrait être mesurable $Y$ ) alors wlog $h$ peut être supposé être mesurable sur tous $\mathcal{Y}$ .

*** Au moins, cela est nécessaire et suffisant pour l'existence d'une fonction arbitraire prenant en compte $g$ et plus $f$ , et je pense que ** implique que si une telle fonction arbitraire existe, cette fonction doit également être mesurable, car les deux $f$ et $g$ sont, ce serait vraiment une statistique $\mathcal{Y} \to \mathcal{Z}$ .

**** La condition donnée est équivalente à $T$ étant suffisant par le théorème de factorisation, 3.6.

— Chill2Macht
source

Comment définissez-vous le rapport de vraisemblance?

— Xi'an

@ Xi'an Je ne me souviens pas vraiment de toutes les choses stupides que j'ai écrites ci-dessus, donc pour être honnête, je ne sais pas de quelle partie vous parlez. Si vous suggérez implicitement que je prouve d'abord que la statistique du rapport de vraisemblance est minimale suffisante, puis que je réduise toute autre preuve de suffisance minimale à une "équivalence de suffisance" appropriée avec la statistique du rapport de vraisemblance, cela est probablement utile en pratique, mais au moins théoriquement semble seulement donner un coup de pied au bas de la route (car alors comment comprendre la preuve de la suffisance minimale de la statistique LR?)

— Chill2Macht