Quelle est la logique de la fonction de covariance de Matérn?


19

La fonction de covariance de Matérn est couramment utilisée comme fonction de noyau dans le processus gaussien. Il est défini comme ceci

Cν(d)=σ221νΓ(ν)(2νdρ)νKν(2νdρ)

d est une fonction de distance (telle que la distance euclidienne), Γ est la fonction gamma, Kν est la fonction de Bessel modifiée du deuxième type, ρ et ν sont des paramètres positifs. ν est beaucoup de temps choisi pour être 32 ou52 en pratique.

Souvent, ce noyau fonctionne mieux que le noyau gaussien standard car il est «moins fluide», mais à part cela, y a-t-il une autre raison pour laquelle on préférerait ce noyau? Une certaine intuition géométrique sur la façon dont il se comporte, ou une explication de la formule apparemment cryptique serait très appréciée.

Réponses:


18

En plus de @DahnJahn belle réponse, j'ai pensé que j'essaierais d'en dire un peu plus sur la provenance des fonctions Bessel et gamma. Un point de départ pour arriver à la fonction de covariance est le théorème de Bochner.

Théorème (Bochner) Une fonction stationnaire continue est définie positive si et seulement si ˜ k est la transformée de Fourier d'une mesure positive finie: ˜ k ( t ) = R e - i ω t d µ ( ω )k(x,y)=k~(|xy|)k~

k~(t)=Reiωtdµ(ω)

On peut en déduire que la matrice de covariance de Matérn est dérivée comme transformée de Fourier de (Source). C'est très bien, mais cela ne nous dit pas vraiment comment vous arrivez à cette mesure positive finie donnée par11(1+ω2)p . Eh bien, c'est la densité spectrale (puissance) d'un processus stochastiquef(x).1(1+ω2)pf(x)

Quel processus stochastique? On sait qu'un processus aléatoire sur avec une fonction de covariance de Matérn est une solution à l'équation différentielle partielle stochastique (SPDE) ( κ 2 - ) α / 2 X ( s ) = φ W ( s ) ,W ( s ) est un bruit blanc gaussien avec variance unitaire, Δ = d i = 1 2Rd

(κ2)α/2X(s)=φW(s),
W(s) est l'opérateur de Laplace, etα=ν+d/2(je pense que c'est dansCressie et Wikle).
Δ=i=1d2xi2
α=ν+d/2

Pourquoi choisir ce processus SPDE / stochastique particulier? L'origine est dans les statistiques spatiales où l'on soutient que c'est la covariance la plus simple et naturelle qui fonctionne bien dans :R2

La fonction de corrélation exponentielle est une corrélation naturelle dans une dimension, car elle correspond à un processus de Markov. En deux dimensions, ce n'est plus le cas, bien que l'exponentielle soit une fonction de corrélation courante dans le travail géostatistique. Whittle (1954) a déterminé la corrélation correspondant à une équation différentielle stochastique de type Laplace:

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
ϵ

AR(1)AR(p)p

Cette fonction de covariance n'est pas liée au processus de cluster de Matérn.

Les références

Cressie, Noel et Christopher K. Wikle. Statistiques pour les données spatio-temporelles. John Wiley & Sons, 2015.

Guttorp, Peter et Tilmann Gneiting. "Etudes en histoire des probabilités et statistiques XLIX Sur la famille de corrélation Matern." Biometrika 93,4 (2006): 989-995.

Rasmussen, CE et Williams, CKI Gaussian Processes for Machine Learning. the MIT Press, 2006.


2
ν=p1/2pCAR(p)pCAR(p)

C'est un malentendu évident de ma part, je vais mettre à jour la réponse. Je vous remercie!
MachineEpsilon

16

Je ne sais pas, mais j'ai trouvé cette question très intéressante et voici ce que j'ai obtenu après un peu de lecture.

νν=5/2

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

νν1

Ceci est assez bien démontré sur une photo prise de Rasmussen & Williams (2006) CE Rasmussen & CKI Williams, Gaussian Processes for Machine Learning, MIT Press, 2006, ISBN 026218253X.  c 2006 Massachusetts Institute of Technology.  www.GaussianProcess.org/gpml

Dans Interpolation of Spatial Data , Stein (qui a en fait proposé le nom de la fonction de covariance de Matérn), soutient (p. 30) que la différentiabilité infinie de la fonction de covariance gaussienne donne des résultats irréalistes pour les processus physiques, car en observant seulement une petite fraction continue de l'espace / temps devrait, en théorie, produire la fonction entière. Il a ainsi proposé la version Matérn comme une généralisation capable de faire correspondre les processus physiques de façon plus réaliste.

Sommaire

ν

ν


1
(+1) J'étais curieux de savoir s'il y avait une explication ou une dérivation de cette fonction de covariance dans le livre de Matérn pub.epsilon.slu.se/10033/1/… ? Je n'ai pas pu le localiser jusqu'à présent. Cette fonction de covariance semble avoir une place très importante dans le livre de Stein, donc je veux en savoir plus.
MachineEpsilon

@Machineepsilon Matérn mentionne-t-il / définit-il tous réellement la fonction? J'ai eu l'impression dans le livre de Stein qu'il était le seul à l'avoir inventé et ne l'avait nommé que d'après Matérn.
Dahn

Je ne suis pas sûr, c'est un peu ce que je voulais savoir! J'essaierai d'y jeter un œil car Rasmussen fait également référence au livre.
MachineEpsilon
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.