J'essaie d'apprendre les statistiques parce que je trouve que c'est tellement répandu que cela m'interdit d'apprendre certaines choses si je ne les comprends pas correctement. J'ai du mal à comprendre cette notion de distribution d'échantillonnage des moyennes d'échantillonnage. Je ne comprends pas comment certains livres et sites l'ont expliqué. Je pense que j'ai une compréhension mais je ne sais pas si c'est correct. Ci-dessous est ma tentative de le comprendre.
Lorsque nous parlons d'un phénomène prenant une distribution normale, il s'agit généralement (pas toujours) de la population.
Nous voulons utiliser des statistiques inférentielles pour prédire certaines choses sur une population, mais nous n'avons pas toutes les données. Nous utilisons un échantillonnage aléatoire et chaque échantillon de taille n est tout aussi susceptible d'être sélectionné.
Nous prenons donc beaucoup d'échantillons, disons 100, puis la distribution des moyennes de ces échantillons sera approximativement normale selon le théorème de la limite centrale. La moyenne des moyennes de l'échantillon se rapprochera de la moyenne de la population.
Maintenant, ce que je ne comprends pas, c'est la plupart du temps que vous voyez "Un échantillon de 100 personnes…" Ne faudrait-il pas 10 ou 100 échantillons de 100 personnes pour approximer la population de la moyenne? Ou est-ce le cas que nous pouvons prélever un seul échantillon suffisamment grand, disons 1000, puis dire que la moyenne se rapprochera de la moyenne de la population? OU prenons-nous un échantillon de 1 000 personnes, puis prenons 100 échantillons aléatoires de 100 personnes dans chaque échantillon de ces 1 000 personnes originales que nous avons prises, puis utilisons-les comme approximation?
Est-ce que le fait de prélever un échantillon suffisamment grand pour approximer la moyenne fonctionne (presque) toujours? La population doit-elle même être normale pour que cela fonctionne?