Ceci est la définition de la statistique sur wikipedia
Plus formellement, la théorie statistique définit une statistique comme une fonction d'un échantillon où la fonction elle-même est indépendante de la distribution de l'échantillon; c'est-à-dire que la fonction peut être indiquée avant la réalisation des données. Le terme statistique est utilisé à la fois pour la fonction et pour la valeur de la fonction sur un échantillon donné.
Je pense que je comprends la plupart de cette définition, mais la partie - où la fonction est indépendante de la distribution de l'échantillon, je n'ai pas été en mesure de trier.
Ma compréhension des statistiques jusqu'à présent
Un échantillon est un ensemble de réalisations d'un certain nombre de variables aléatoires indépendantes identiquement distribuées (iid) avec la distribution F (10 réalisations d'un lancer de dés équitables à 20 faces, 100 réalisations de 5 lancées d'un dés équitables à 6 faces, tirer au hasard 100 personnes dans une population).
Une fonction, dont le domaine est cet ensemble, et dont la plage est les nombres réels (ou peut-être qu'elle peut produire d'autres choses, comme un vecteur ou un autre objet mathématique ...) serait considérée comme une statistique .
Quand je pense à des exemples, la moyenne, la médiane, la variance ont tous un sens dans ce contexte. Ils sont fonction d'un ensemble de réalisations (mesures de la pression artérielle à partir d'un échantillon aléatoire). Je peux aussi voir comment un modèle de régression linéaire pourrait être considéré comme une statistique - n'est-ce pas simplement une fonction sur un ensemble de réalisations?
Où je suis confus
En supposant que ma compréhension ci-dessus est correcte, je n'ai pas pu comprendre où une fonction pourrait ne pas être indépendante de la distribution de l'échantillon. J'ai essayé de trouver un exemple pour le comprendre, mais pas de chance. Toute opinion serait très appréciée!