@Ferdi a déjà fourni une réponse claire à votre question, mais rendons-la un peu plus formelle.
Laissez être votre échantillon de variables aléatoires indépendantes et identiquement distribuées de la distribution . Vous souhaitez estimer une quantité inconnue mais fixe , en utilisant l' estimateur étant une fonction de . Puisque est une fonction de variables aléatoires, estimezX1,…,XnFθg X 1 , … , X n g gX1,…,Xng
θ^n=g(X1,…,Xn)
est également une variable aléatoire. Nous définissons le biais comme
bias(θ^n)=Eθ(θ^n)−θ
l'estimateur est sans biais lorsque .Eθ(θ^n)=θ
En termes simples: nous avons affaire à des variables aléatoires , donc à moins qu'elles ne dégénèrent , si nous prenons des échantillons différents, nous pouvons nous attendre à observer des données différentes et donc des estimations différentes. Néanmoins, nous pourrions nous attendre à ce que sur différents échantillons "en moyenne" estimés serait "correct" si l'estimateur n'est pas biaisé. Ce ne serait donc pas toujours vrai, mais "en moyenne", ce serait bien. Elle ne peut tout simplement pas toujours être «correcte» en raison du caractère aléatoire associé aux données.θ^n
Comme d'autres l'ont déjà noté, le fait que votre estimation se "rapproche" de la quantité estimée à mesure que votre échantillon croît, c'est-à-dire qu'en converge en probabilité
θ^n→Pθ
a à voir avec la cohérence des estimateurs , non avec la non-impartialité. L'impartialité seule ne nous dit rien sur la taille de l'échantillon et sa relation avec les estimations obtenues. De plus, les estimateurs non biaisés ne sont pas toujours disponibles et pas toujours préférables aux estimés biaisés. Par exemple, après avoir considéré le compromis biais-variance, vous pouvez envisager d'utiliser un estimateur avec un biais plus important, mais une variance plus petite - donc "en moyenne", il serait plus éloigné de la valeur réelle, mais plus souvent (variance plus petite), les estimations seraient être plus proche de la valeur réelle, puis en cas d'estimateur sans biais.