Confusion concernant le krigeage

9

Je lisais cet article wikipedia sur le krigeage. Je n'ai pas compris la partie quand on dit que

Le krigeage calcule le meilleur estimateur linéaire sans biais, , de telle sorte que la variance de krigeage de est minimisée avec la condition de non biais. Je n'ai pas obtenu la dérivation et aussi comment la variance est minimisée. Aucune suggestion? $\hat Z (x_0)$ $Z(x_0)$

Surtout, je n'ai pas obtenu la partie où s'applique minimisé sous réserve de condition de non biais.

Je pense que ça aurait dû être

E [Z '(x0) -Z (x0)] au lieu de E [Z' (x) -Z (x)] n'est-ce pas. 'est équivalent à hat dans l'article wiki. De plus, je n'ai pas compris comment l'erreur de krigeage est dérivée

interpolation

— user31820
source

Où vous bloquez-vous dans la dérivation?

— whuber

La partie où il calcule l'erreur de krigeage et impose la condition de non biais. Il est bon de dire qu'une condition sans biais signifie que l'espérance de l'estimateur et la vraie est égale. J'ai modifié le message pour inclure les détails.

— user31820

Je pense que vous avez raison de dire que l'expression Wikipedia doit lire .

E [Z^{'} (x_{0}) - Z (x_{0})]

$E[Z'(x_0)-Z(x_0)]$

— whuber

13

Supposons que est un vecteur supposé avoir une distribution multivariée de moyenne inconnue et une matrice de variance-covariance connue . Nous observons partir de cette distribution et souhaitons prédire partir de ces informations en utilisant un prédicteur linéaire non biaisé: $\left(Z_0, Z_1, \ldots, Z_n\right)$ $(\mu, \mu, \ldots, \mu)$ $\Sigma$ $\left(z_1, z_2, \ldots, z_n\right)$ $z_0$

Linéaire signifie que la prédiction doit prendre la forme pour que les coefficients soient déterminés. Ces coefficients peuvent dépendre au maximum de ce qui est connu à l'avance: à savoir les entrées de . $\hat{z_0} = \lambda_1 z_1 + \lambda_2 z_2 + \cdots + \lambda_n z_n$ $\lambda_i$ $\Sigma$

Ce prédicteur peut également être considéré comme une variable aléatoire . $\hat{Z_0} = \lambda_1 Z_1 + \lambda_2 Z_2 + \cdots + \lambda_n Z_n$

Sans biais signifie que l'attente de est égale à sa moyenne (inconnue) . $\hat{Z_0}$ $\mu$

L'écriture donne quelques informations sur les coefficients:

\begin{aligned} μ & = E [\hat{Z_{0}}] = E [λ_{1} Z_{1} + λ_{2} Z_{2} + \dots + λ_{n} Z_{n}] \\ = λ_{1} E [Z_{1}] + λ_{2} E [Z_{2}] + \dots + λ_{n} E [Z_{n}] \\ = λ_{1} μ + \dots + λ_{n} μ \\ = (λ_{1} + \dots + λ_{n}) μ . \end{aligned}

$\eqalign{ \mu &= E[\hat{Z_0}] = E[\lambda_1 Z_1 + \lambda_2 Z_2 + \cdots + \lambda_n Z_n] \\ &= \lambda_1 E[Z_1] + \lambda_2 E[Z_2] + \cdots + \lambda_n E[Z_n] \\ &= \lambda_1 \mu + \cdots + \lambda_n \mu \\ &= \left(\lambda_1 + \cdots + \lambda_n\right) \mu. \\ }$

La deuxième ligne est due à la linéarité de l'attente et tout le reste est une algèbre simple. Étant donné que cette procédure est supposée fonctionner quelle que soit la valeur de , les coefficients doivent évidemment correspondre à l'unité. En écrivant les coefficients en notation vectorielle , cela peut être soigneusement écrit . $\mu$ $\lambda = (\lambda_i)'$ $\mathbf{1}\lambda=1$

Parmi l'ensemble de tous ces prédicteurs linéaires non biaisés, nous en recherchons un qui s'écarte le moins possible de la valeur réelle , mesurée dans le carré moyen de la pièce. Encore une fois, c'est un calcul. Il s'appuie sur la bilinéarité et la symétrie de covariance, dont l'application est responsable des sommations de la deuxième ligne:

\begin{aligned} E [(\hat{Z_{0}} - Z_{0})^{2}] & = E [(λ_{1} Z_{1} + λ_{2} Z_{2} + \dots + λ_{n} Z_{n} - Z_{0})^{2}] \\ = \sum_{i = 1}^{n} \sum_{j = 1}^{n} λ_{i} λ_{j} var [Z_{i}, Z_{j}] - 2 \sum_{i = 1}^{n} λ_{i} var [Z_{i}, Z_{0}] + var [Z_{0}, Z_{0}] \\ = \sum_{i = 1}^{n} \sum_{j = 1}^{n} λ_{i} λ_{j} Σ_{i, j} - 2 \sum_{i = 1}^{n} λ_{i} Σ_{0, i} + Σ_{0, 0} . \end{aligned}

$\eqalign{ E[(\hat{Z_0} - Z_0)^2] &= E[(\lambda_1 Z_1 + \lambda_2 Z_2 + \cdots + \lambda_n Z_n - Z_0)^2] \\ &= \sum_{i=1}^n \sum_{j=1}^n \lambda_i \lambda_j \text{var}[Z_i, Z_j]-2\sum_{i=1}^n\lambda_i \text{var}[Z_i, Z_0] + \text{var}[Z_0, Z_0] \\ &= \sum_{i=1}^n \sum_{j=1}^n \lambda_i \lambda_j \Sigma_{i,j} - 2\sum_{i=1}^n\lambda_i\Sigma_{0,i} + \Sigma_{0,0}. }$

D'où les coefficients peuvent être obtenus en minimisant cette forme quadratique soumise à la contrainte (linéaire) . Ceci est facilement résolu en utilisant la méthode des multiplicateurs de Lagrange, ce qui donne un linéaire système d'équations, les équations de krigeage « » $\mathbf{1}\lambda=1$

Dans l'application, est un processus spatial stochastique ("champ aléatoire"). Cela signifie que pour tout ensemble donné d'emplacements fixes (non aléatoires) , le vecteur de valeurs de à ces emplacements, est aléatoire avec une sorte de distribution multivariée. Écrivez et appliquez l'analyse précédente, en supposant que les moyennes du processus à tous les emplacements sont les mêmes et en supposant que la matrice de covariance des valeurs du processus à ces emplacements sont connus avec certitude. $Z$ $\mathbf{x_0}, \ldots, \mathbf{x_n}$ $Z$ $\left(Z(\mathbf{x_0}), \ldots, Z(\mathbf{x_n})\right)$ $Z_i = Z(\mathbf{x_i})$ $n+1$ $\mathbf{x_i}$ $n+1$

Interprétons cela. Selon les hypothèses (y compris la moyenne constante et la covariance connue), les coefficients déterminent la variance minimale pouvant être atteinte par tout estimateur linéaire. Appelons cette variance ("OK" est pour "krigeage ordinaire"). Cela dépend uniquement de la matrice . Il nous dit que si nous devions échantillonner à plusieurs reprises de et utiliser ces coefficients pour prédire les valeurs partir des valeurs restantes à chaque fois, alors $\sigma_{OK}^2$ $\Sigma$ $\left(Z_0, \ldots, Z_n\right)$ $z_0$

En moyenne, nos prévisions seraient correctes.
Typiquement, nos prédictions du s'écarteraient d'environ des valeurs réelles du . $z_0$ $\sigma_{OK}$ $z_0$

Beaucoup plus doit être dit avant que cela puisse être appliqué à des situations pratiques comme l'estimation d'une surface à partir de données ponctuelles: nous avons besoin d'hypothèses supplémentaires sur la façon dont les caractéristiques statistiques du processus spatial varient d'un endroit à l'autre et d'une réalisation à une autre (même si , en pratique, une seule réalisation sera généralement disponible). Mais cette exposition devrait être suffisante pour suivre comment la recherche d'un «meilleur» prédicteur linéaire sans biais («BLUP») mène directement à un système d'équations linéaires.

Soit dit en passant, le krigeage tel qu'il est habituellement pratiqué n'est pas tout à fait la même chose que l'estimation des moindres carrés, car est estimé dans une procédure préliminaire (connue sous le nom de "variographie") utilisant les mêmes données. Cela est contraire aux hypothèses de cette dérivation, qui supposait que était connu (et a fortiori indépendant des données). Ainsi, au tout début, le krigeage comporte des défauts conceptuels et statistiques. Les pratiquants réfléchis ont toujours été conscients de cela et ont trouvé divers moyens créatifs pour (essayer de) justifier les incohérences. (Avoir beaucoup de données peut vraiment aider.) Il existe maintenant des procédures pour estimer simultanément $\Sigma$ $\Sigma$ $\Sigma$ et prédire une collection de valeurs à des endroits inconnus. Ils nécessitent des hypothèses légèrement plus fortes (normalité multivariée) pour accomplir cet exploit.

— whuber
source

Il y a un site Web là-bas où ils se moquent du krigeage et il semble qu'il ait des points valables. Je pense que votre dernier paragraphe est très éclairant.

— Wayne

@Wayne Oui, vous pouvez dire à quoi je réagis. Mais bien que le krigeage ait été utilisé comme "huile de serpent" par les consultants, il a beaucoup à faire, y compris une théorie du "changement de support" pour comparer les données obtenues à partir (par exemple) de minuscules échantillons d'un milieu à des données obtenues à partir de beaucoup plus grands portions de ce milieu. Le krigeage est finalement à la base de la modélisation spatio-temporelle la plus sophistiquée aujourd'hui. C'est également un moyen utile d'évaluer des propositions alternatives: par exemple, de nombreux interpolateurs spatiaux sont linéaires (ou peuvent être linéarisés), il est donc juste de comparer leur variance d'estimation à celle du krigeage.

— whuber

1

Le krigeage est simplement une estimation des moindres carrés pour les données spatiales. À ce titre, il fournit un estimateur linéaire sans biais qui minimise la somme des erreurs quadratiques. Puisqu'il est sans biais, le MSE = la variance de l'estimateur et est un minimum.

— Michael R. Chernick
source

Je n'ai pas eu la partie calculant l'erreur de krigeage. Je suis également confondu avec la variance et la variance du krigeage. Quelle est la différence et quelle est leur signification

— user31820

@whuber. Merci pour l'explication, mais je n'ai pas obtenu la dérivation de l'équation lorsque vous avez calculé le MSE de la valeur prédite par l'estimation non biaisée et l'estimateur vrai. La deuxième ligne à être spécifique dans cette équation

— user31820

@whuber Je n'ai pas non plus reçu la partie wiki quand elle calcule la variance de krigeage qui est similaire à celle de votre réponse. Ils ont les mêmes résultats mais les termes initiaux sont différents. Comment venir?

— user31820