J'ai pensé à ce problème plus récemment, et voici ce que j'ai trouvé.
Laisser Ωêtre un espace de probabilité, puis une variable aléatoire X est une fonction mesurable X: Ω → X, où X est un espace mesurable (X a désigné σ-algèbre, et X est mesurable par rapport à cette σ-algèbre et σ-algèbre sur Ω). La répartition desX est juste la mesure de retrait X, c'est à dire PX( A ) =PΩ(X- 1( A ) ). Ensuite, une statistique deX est une fonction mesurable * F: X→ Y, où Oui est un autre espace mesurable arbitraire.
Étant donné deux statistiques F: X→ Y, g: X→ Z, qu'est-ce que cela signifie pour "g être fonction de F"?
Pour autant que je sache, cela semble signifier qu'il existe une fonction mesurable ** h : Y→ Z tel que g= h ∘ f, c'est-à-dire que gpeut être pris en compte parF.
(En d'autres termes, "g doit être bien défini en fonction de F( X) ⊆ Y".)
Alors, quand un tel affacturage est-il possible? Pensons en termes de relations d'équivalence. Plus précisément, définissez la relation d'équivalence∼F sur X par x1∼FX2⟺F(X1) =f(X2), de même, définir la relation d'équivalence ∼g sur X par X1∼gX2⟺g(X1) =g(X2).
Ensuite, pour g être factorisable par F, les relations d'équivalence ∼F et ∼g doivent être compatibles les uns avec les autres, dans le sens *** que pour tout X1,X2∈ X, X1∼FX2⟹X1∼gX2, c'est à dire g ne peut pas prendre deux éléments équivalents sous F et les mapper à des valeurs qui ne sont pas équivalentes sous g, c'est à dire "g ne peut pas annuler la réduction d'informations précédemment effectuée par F".
En d'autres termes, g doit être bien défini en fonction de X/∼F≅F( X)c'est-à-dire qu'il doit exister une fonction g~: X/∼F→ Z tel que g=g~∘πF, où πF est la projection canonique X→X/∼f. (Pour ceux qui ne sont pas à l'aise avec le non-sens abstrait,πf est essentiellement f, et g~ est essentiellement h. La formulation ci-dessus rend plus claires les analogies avec d'autres situations.)
En termes les plus simples possibles, g peut être écrit en fonction de f si et seulement si, pour tout x1,x2∈X, f(x1)=f(x2)⟹g(x1)=g(x2).
Par exemple, prenez X=Y=Z=R et X une variable aléatoire arbitraire à valeur réelle, puis g:x↦x2 peut être écrit en fonction de f:x↦x, mais pas l'inverse, car x1=x2⟹x21=x22, mais 12=(−1)2 mais 1≠−1.
En particulier, supposons que chaque classe d'équivalence sous ∼f est un singleton (c.-à-d. fest injective ). alorsg peut toujours être écrit en fonction de f, depuis X/∼f≅X, c'est à dire f(x1)=f(x2)⟹x1=x2 signifie que x1=x2⟺f(x1)=f(x2) (en général, pour les injections non nécessairement f, une seule direction tient), donc notre condition devient x1=x2⟹g(x1)=g(x2), qui est trivialement satisfait pour tout g:X→Z. (Définirh, il peut faire tout ce qu'il veut sur Y∖f(X) tant qu'il est mesurable, puis pour tout y∈f(X), c'est-à-dire tels que y=f(x) pour certains x∈X, définir h être h:y=f(x)↦g(x). Ceci est bien défini lorsquefest injectif parce qu'il y a un unique x∈X tel que f(x)=y. Plus généralement, cela n'est défini que lorsque, quel que soitx nous choisissons f−1(y), g(x) est toujours la même valeur, à savoir f(x1)=f(x2) (=y)⟹g(x1)=g(x2).)
De plus, en regardant le théorème 3.11 dans Keener, sa déclaration est un peu maladroite, mais en pensant dans les termes ci-dessus, je pense qu'elle peut être réécrite comme:
Supposer Test une statistique suffisante ****. Une condition suffisante pourT être minimal suffisant est qu'il peut être écrit en fonction du rapport de vraisemblance.
À partir de cela, il devient immédiatement clair que le rapport de vraisemblance doit lui-même être minimal suffisant.
Cela conduit également à la conclusion que:
S'il existe x1,x2∈X tel que f(x1)=f(x2) mais g(x1)≠g(x2), puis gne peut pas être écrit en fonction def, c'est-à-dire qu'il n'existe aucune fonctionh avec g=h∘f.
Ainsi, la condition n'est pas aussi difficile à montrer que je le pensais.
* Keener n'aborde pas la question de savoir si une statistique doit être une fonction mesurable ou simplement arbitraire ou non. Cependant, je suis assez sûr qu'une statistique doit être une fonction mesurable, car sinon nous ne pourrions pas définir une distribution pour elle , c'est-à-dire une mesure de retrait.
**Si h n'étaient pas mesurables, nous aurions une contradiction car les deux f et gsont mesurables et la composition des fonctions mesurables est à nouveau mesurable. Tout au moins,h doit être mesurable limité à f(X)⊆Y, bien que je pense que cela signifierait dans la plupart des cas raisonnables que h devrait se mettre d'accord sur f(X) avec une fonction mesurable sur tous Y (prendre h|f(X) sur f(X) et par exemple z sur Y∖f(X) s'il existe un point mesurable z∈Z, notez que les deux f(X) et Y∖f(X) devrait être mesurable Y) alors wlog h peut être supposé être mesurable sur tous Y.
*** Au moins, cela est nécessaire et suffisant pour l'existence d'une fonction arbitraire prenant en compte g et plus f, et je pense que ** implique que si une telle fonction arbitraire existe, cette fonction doit également être mesurable, car les deux f et g sont, ce serait vraiment une statistique Y→Z.
**** La condition donnée est équivalente à T étant suffisant par le théorème de factorisation, 3.6.