La définition d'une statistique suffisante est: Soit être un échantillon aléatoire d'une distribution indexée par un paramètre . Laisserêtre une statistique. Supposons que, pour chaque et toutes les valeurs possibles de , la distribution conjointe conditionnelle de étant donné que ne dépend que de mais pas sur . Alors, est une statistique suffisante pour le paramètre .
J'ai l'impression de connaître plusieurs pièces du puzzle (comme le théorème de factorisation) pour comprendre des statistiques suffisantes mais je n'ai pas la théorie globale en panne.
Mes principales questions sont:
1) Pourquoi disent-ils que est une statistique suffisante pour le paramètre? Si étaient la moyenne de la population d'une distribution normale, disons , cela signifie-t-il que chaque fois que nous voulons trouver la probabilité, disons, se produisant d'une certaine manière, que nous n'avons pas besoin de la valeur de la moyenne de la population?
2) Dans la vie réelle, pourquoi voulons-nous utiliser une statistique suffisante? Il semble que le simple calcul de la statistique ne devrait pas représenter beaucoup de travail (comme la somme des X), alors pourquoi en avons-nous besoin?
Merci!