Le dénominateur de l'estimateur de variance (non biaisé) est car il y a observations et un seul paramètre est estimé.n
Dans le même esprit, je me demande pourquoi le dénominateur de la covariance ne serait pas lorsque deux paramètres sont estimés?
Le dénominateur de l'estimateur de variance (non biaisé) est car il y a observations et un seul paramètre est estimé.n
Dans le même esprit, je me demande pourquoi le dénominateur de la covariance ne serait pas lorsque deux paramètres sont estimés?
Réponses:
Les covariances sont des variances.
Depuis par l' identité de polarisation
les dénominateurs doivent être les mêmes.
Un cas particulier devrait vous donner une intuition; Pensez à ce qui suit:
Vous êtes heureux que ce dernier soit raison de la Correction de Bessel.
Mais remplacer par dans pour le premier donne , alors que pensez-vous qu'il serait préférable de compléter?X ^ C o v ( X , Y ) Σ n i = 1 ( X i - ¯ X ) ( X i - ¯ X )
Une réponse rapide et sale ... Considérons d’abord ; si vous aviez observations dont la valeur attendue était connue vous utiliseriez pour estimer la variance.n E ( X ) = 0 1
La valeur attendue étant inconnue, vous pouvez transformer vos observations en observations avec une valeur attendue connue en prenant pour . Vous obtiendrez une formule avec un dans le dénominateur - mais les ne sont pas indépendants et vous devrez en tenir compte; à la fin, vous retrouveriez la formule habituelle.n - 1 A i = X i - X 1 i = 2 , … , n n - 1 A i
Maintenant, pour la covariance, vous pouvez utiliser la même idée: si la valeur attendue de était , vous auriez eu un dans la formule. En soustrayant à toutes les autres valeurs observées, vous obtenez observations dont la valeur attendue est connue ... et un dans la formule - une fois encore, cela introduit une certaine dépendance à prendre en compte. Compte.( 0 , 0 ) 1 (X1,Y1)n-11
PS La méthode la plus simple consiste à choisir une base orthonormale de , c’est-à-dire vecteurs tel que n-1c1,...,c n - 1 ∈ R n
Vous pouvez ensuite définir variables et . Les sont indépendants, ont une valeur attendue et ont la même variance / covariance que les variables d'origine.
Tout ce qui compte, c’est que si vous voulez vous débarrasser de l’attente inconnue, vous laissez tomber une (et une seule) observation. Cela fonctionne de la même manière dans les deux cas.
Voici une preuve que l'estimateur de covariance d'échantillon p-variable avec le dénominateur est un estimateur sans biais de la matrice de covariance:
.
Pour afficher:
Preuve:
Prochain:
(1)
(2)
Par conséquent,
Et ainsi , avec le dénominateur final , est non biaisé. Les éléments non diagonaux de sont vos échantillons de covariance.
Remarque additionnelle:
Les tirages n sont indépendants. Ceci est utilisé dans (2) pour calculer la covariance de la moyenne de l'échantillon.
Les étapes (1) et (2) utilisent le fait que
L’étape (2) utilise le fait que
Je suppose qu’une façon de construire l’intuition derrière l’utilisation de 'n-1' et non de 'n-2' est - que pour calculer la co-variance, nous n’avons pas besoin de dé-signifier X et Y, mais l’un ou l’autre, à savoir
1) Commencez .
2) covariance d' échantillon est proportionnelle à . Perdre deux d f ; une de ˉ X , un de ˉ Y résultant en d f = 2 ( n - 1 ) .
3) Toutefois, ne contient que des n termes distincts, un pour chaque produit. Lorsque deux nombres sont multipliés ensemble, les informations indépendantes de chaque numéro séparé disparaissent.
Par exemple, considérons que
,
et cela n'inclut pas les irrationnels et les fractions, par exemple , de sorte que lorsque nous multiplions deux séries de nombres ensemble et examinions leur produit, nous ne voyons que ledf=n-1d’une série de chiffres, car nous avons perdu la moitié de l’information originale, c’est-à-dire quels étaient ces deux nombres. avant que le regroupement par paires en un seul nombre (c’est-à-dire la multiplication) ait été effectué.
En d'autres termes, sans perte de généralité, nous pouvons écrire
pour certains z i et ˉ z ,
ie, , et, ˉ z = ˉ X ˉ Y . À partir des z , qui ont alors clairement d f = n - 1 , la formule de covariance devient
Hold
?