Supposons que est un vecteur supposé avoir une distribution multivariée de moyenne inconnue et une matrice de variance-covariance connue . Nous observons partir de cette distribution et souhaitons prédire partir de ces informations en utilisant un prédicteur linéaire non biaisé:(Z0,Z1,…,Zn)(μ,μ,…,μ)Σ(z1,z2,…,zn) z0
- Linéaire signifie que la prédiction doit prendre la forme pour que les coefficients soient déterminés. Ces coefficients peuvent dépendre au maximum de ce qui est connu à l'avance: à savoir les entrées de .z0^=λ1z1+λ2z2+⋯+λnznλiΣ
Ce prédicteur peut également être considéré comme une variable aléatoire .Z0^=λ1Z1+λ2Z2+⋯+λnZn
- Sans biais signifie que l'attente de est égale à sa moyenne (inconnue) .Z0^μ
L'écriture donne quelques informations sur les coefficients:
μ=E[Z0^]=E[λ1Z1+λ2Z2+⋯+λnZn]=λ1E[Z1]+λ2E[Z2]+⋯+λnE[Zn]=λ1μ+⋯+λnμ=(λ1+⋯+λn)μ.
La deuxième ligne est due à la linéarité de l'attente et tout le reste est une algèbre simple. Étant donné que cette procédure est supposée fonctionner quelle que soit la valeur de , les coefficients doivent évidemment correspondre à l'unité. En écrivant les coefficients en notation vectorielle , cela peut être soigneusement écrit .μλ=(λi)′1λ=1
Parmi l'ensemble de tous ces prédicteurs linéaires non biaisés, nous en recherchons un qui s'écarte le moins possible de la valeur réelle , mesurée dans le carré moyen de la pièce. Encore une fois, c'est un calcul. Il s'appuie sur la bilinéarité et la symétrie de covariance, dont l'application est responsable des sommations de la deuxième ligne:
E[(Z0^−Z0)2]=E[(λ1Z1+λ2Z2+⋯+λnZn−Z0)2]=∑i=1n∑j=1nλiλjvar[Zi,Zj]−2∑i=1nλivar[Zi,Z0]+var[Z0,Z0]=∑i=1n∑j=1nλiλjΣi,j−2∑i=1nλiΣ0,i+Σ0,0.
D'où les coefficients peuvent être obtenus en minimisant cette forme quadratique soumise à la contrainte (linéaire) . Ceci est facilement résolu en utilisant la méthode des multiplicateurs de Lagrange, ce qui donne un linéaire système d'équations, les équations de krigeage « »1λ=1
Dans l'application, est un processus spatial stochastique ("champ aléatoire"). Cela signifie que pour tout ensemble donné d'emplacements fixes (non aléatoires) , le vecteur de valeurs de à ces emplacements, est aléatoire avec une sorte de distribution multivariée. Écrivez et appliquez l'analyse précédente, en supposant que les moyennes du processus à tous les emplacements sont les mêmes et en supposant que la matrice de covariance des valeurs du processus à ces emplacements sont connus avec certitude.Zx0,…,xnZ(Z(x0),…,Z(xn))Zi=Z(xi)n+1xin+1
Interprétons cela. Selon les hypothèses (y compris la moyenne constante et la covariance connue), les coefficients déterminent la variance minimale pouvant être atteinte par tout estimateur linéaire. Appelons cette variance ("OK" est pour "krigeage ordinaire"). Cela dépend uniquement de la matrice . Il nous dit que si nous devions échantillonner à plusieurs reprises de et utiliser ces coefficients pour prédire les valeurs partir des valeurs restantes à chaque fois, alorsσ2OKΣ(Z0,…,Zn)z0
En moyenne, nos prévisions seraient correctes.
Typiquement, nos prédictions du s'écarteraient d'environ des valeurs réelles du .z0σOKz0
Beaucoup plus doit être dit avant que cela puisse être appliqué à des situations pratiques comme l'estimation d'une surface à partir de données ponctuelles: nous avons besoin d'hypothèses supplémentaires sur la façon dont les caractéristiques statistiques du processus spatial varient d'un endroit à l'autre et d'une réalisation à une autre (même si , en pratique, une seule réalisation sera généralement disponible). Mais cette exposition devrait être suffisante pour suivre comment la recherche d'un «meilleur» prédicteur linéaire sans biais («BLUP») mène directement à un système d'équations linéaires.
Soit dit en passant, le krigeage tel qu'il est habituellement pratiqué n'est pas tout à fait la même chose que l'estimation des moindres carrés, car est estimé dans une procédure préliminaire (connue sous le nom de "variographie") utilisant les mêmes données. Cela est contraire aux hypothèses de cette dérivation, qui supposait que était connu (et a fortiori indépendant des données). Ainsi, au tout début, le krigeage comporte des défauts conceptuels et statistiques. Les pratiquants réfléchis ont toujours été conscients de cela et ont trouvé divers moyens créatifs pour (essayer de) justifier les incohérences. (Avoir beaucoup de données peut vraiment aider.) Il existe maintenant des procédures pour estimer simultanémentΣΣΣet prédire une collection de valeurs à des endroits inconnus. Ils nécessitent des hypothèses légèrement plus fortes (normalité multivariée) pour accomplir cet exploit.