MLE d'un processus Hawkes multivarié


9

J'ai du mal à mettre en œuvre l'estimateur du maximum de vraisemblance pour un processus Hawkes multivarié (HP). Plus précisément, alors que l'expression analytique pour une fonction log-vraisemblance d'un HP univarié peut être trouvée facilement en ligne (par exemple Ozaki, 1979), il semble y avoir différentes versions (incohérentes ou équivalentes?) De la fonction log-vraisemblance d'un HP multivarié là-bas. J'ai également essayé de dériver l'estimateur moi-même ci-dessous et j'obtiens encore un autre résultat (je suis très nouveau sur ce sujet cependant). Quelqu'un pourrait-il clarifier cela pour moi? Merci!

Ceci est mon propre essai de dérivation (je suis la notation utilisée dans Laub et al., 2015). Considérons une collection de processus de comptage avec les heures d'arrivée observées pour chaque processus de comptage ( et a entier naturel). Définissez un HP multivarié avec des fonctions d'exictation en décroissance exponentielle telles que les intensités soient . Pour cette variable m HP, la log-vraisemblance est égale à la somme des log-vraisemblances individuelles, c'est-à-dire:mN=(N1,..,Nm)ti,ji=1,..,mjλi(t)=λi+j=1mtj,k<tαi,jeβi,j(ttj,k)lnL(t)lnL(t)=j=1mlnLj(t), avec chaque composant individuel .lnLj(t)=0Tλj(u)du+0Tlnλj(u)dNj(u)

Concentrons-nous d'abord sur la première partie, que nous appelons le compensateur .Λ

entrez la description de l'image ici

La combinaison de cela avec les résultats pour les autres parties de la log-vraisemblance devrait entraîner: lnL1(ti)=λ1Tα1,1β1,1f=1F[eβ1,1(t1,Ft1,f)1]α1,2β1,2g=1G[eβ1,2(t2,Gt2,g)1]+f=1Fln[λ1+j=12α1,jR1,j(f)]

avec . Une expression similaire peut être dérivée pour .R1,j(f)=tj,k<t1,feβ1,j(t1,ftj,k)lnL2(ti)

Cependant, lorsque je compare ce résultat avec d'autres articles, je remarque quelques différences. Par exemple, dans Toke (diapositive 56) l'expression du compensateur est très différent (sommes sur tous les éléments pour chaque événement de type) et, aussi, il n'y a pas terme. Ensuite, dans Crowley (2013) (p. 29), l'expression du compensateur est beaucoup plus élaborée. De plus, l'équation de 2.8 (page 9) dans Zheng (2013) offre à nouveau une alternative (somme sur un sous-ensemble des éléments pour chaque type d'événement) (note: il y a une implémentation Matlab à la fin du document). L'article qui ressemble le plus à ce que je trouve est la page 6 de Carlsson et al. (2007). Comme vous pouvez le voir, je suis clairement confus. Quelle est la fonction de vraisemblance correcte que je devrais programmer?λiT

Références:

  • Ozaki, 1979, Estimation du maximum de vraisemblance des processus ponctuels auto-excitants de Hawkes

  • Crowley, 2013, Modèles de processus ponctuels pour les données multivariées à haute fréquence à espacement irrégulier

  • Laub, Taimre & Pollett, 2015, Hawkes Processes

  • Zheng, 2013, Dynamique haute fréquence du flux d'ordres

  • Carlsson, Foo, Lee & Shek, 2007, Prédiction commerciale à haute fréquence avec processus bivarié de Hawkes


Si vous voulez une réponse pour expliquer pourquoi votre résultat diffère d'une référence particulière, je suggère au minimum d'ajouter un lien vers la référence. Mieux encore, fournissez les résultats exacts de la référence dans votre question et expliquez en détail pourquoi vous pensez qu'elle diffère de votre résultat. Cela augmentera les chances que quelqu'un fournisse une réponse.
NRH

Le lien vers mon article est vixra.org/pdf/1211.0094v8.pdf
corbeau

Avez-vous obtenu une réponse à cette question? J'ai remarqué la même chose et c'est très frustrant. Même sur la page wikipedia, la fonction est différente: en.wikipedia.org/wiki/Point_process#Likelihood_function
Freelunch

Réponses:


3

Il y a une petite erreur dans la dérivation. Dans la ligne 5 (dans la figure insérée), il faut pour que l'identité soit correcte, et ce n'est généralement pas le cas. Les termes des sommes finales doivent être et , respectivement. Sinon, la dérivation semble correcte.T=t1,F=t2,Geβi,1(Tt1,f)1eβi,2(Tt2,g)1

Une dérivation légèrement plus simple peut prendre la ligne 3 comme point de départ. Ensuite , échanger les sommes et l' intégration avec l'être intégral intérieure résultant de à .tj,kT

Il convient de noter que pour le processus de Hawkes considéré ici, il est possible de calculer manière récursive, ce qui implique que la complexité de calcul de la log-vraisemblance peut être rendue linéaire dans le nombre de sauts (au lieu de quadratique comme le suggère la double somme des sauts).λi(ti,j)

Je doute qu'il existe des versions incohérentes de la probabilité dans la littérature, mais il peut bien sûr y avoir des erreurs dans certaines références. Une autre possibilité (probable) est que la notation ou les hypothèses diffèrent, ou que les représentations sont, en effet, équivalentes, mais écrites de différentes manières. Une possibilité est que l'intensité de base soit omise, de sorte que le terme disparaisse.λiλiT

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.