La somme pondérée de deux variables aléatoires de Poisson indépendantes


10

En utilisant wikipedia, j'ai trouvé un moyen de calculer la fonction de masse de probabilité résultant de la somme de deux variables aléatoires de Poisson. Cependant, je pense que l'approche que j'ai a tort.

Soit deux variables aléatoires de Poisson indépendantes de moyenne et , où et sont des constantes, alors la fonction génératrice de probabilité de est donnée par Maintenant, en utilisant le fait que la fonction génératrice de probabilité pour une variable aléatoire de Poisson est , nous pouvons écrire la fonction génératrice de probabilité de la somme des deux variables aléatoires de Poisson indépendantes X1,X2λ1,λ2S2=a1X1+a2X2a1a2S2

GS2(z)=E(zS2)=E(za1X1+a2X2)GX1(za1)GX2(za2).
GXi(z)=eλi(z1)
GS2(z)=eλ1(za11)eλ2(za21)=eλ1(za11)+λ2(za21).
Il semble que la fonction de masse de probabilité de soit récupérée en prenant des dérivées de , Où .S2GS2(z) Pr(S2=k)=GS2(k)(0)k!GS2(k)=dkGS2(z)dzk

Est-ce correct? J'ai l'impression que je ne peux pas simplement prendre la dérivée pour obtenir la fonction de masse de probabilité, à cause des constantes et . Est-ce correct? Existe-t-il une approche alternative?a 2a1a2

Si cela est correct, puis-je maintenant obtenir une approximation de la distribution cumulative en tronquant la somme infinie sur tout k?


1
Pourquoi modifiez-vous les sommets avec et ? La somme n'est qu'une autre distribution de Poisson sans cela. Les variables prennent des valeurs dans les entiers positifs, donc quelque chose comme fois la première plus fois la seconde n'est généralement pas naturel, et vous permettrait de récupérer les valeurs des deux variables. a 2 1 a1a212
Douglas Zare

3
La difficulté ici est qu'à moins que et soient des nombres entiers, on ne peut pas être sûr que prend que des valeurs entières. Ainsi, vous devez trouver non seulement pour les valeurs entières de mais aussi pour chaque qui peut être exprimé comme pour les entiers non négatifs et . a 2 S 2 P ( S 2 = k ) k P ( S 2 = α ) α a 1 m + a 2 n m na1a2S2P(S2=k)kP(S2=α)αa1m+a2nmn
Dilip Sarwate

@DilipSarwate Est-ce possible? Existe-t-il une autre approche pour ce faire?
Michel

@DouglasZare Je dois le faire ... Peut-être que je dois me tourner vers une sorte de méthode d'amorçage.
Michel

1
Je ne pense pas que vous puissiez faire beaucoup mieux qu'une approche par force brute qui trouve les valeurs possibles que peut prendre, puis pour chaque , utilisezPour la plupart des choix de et , je m'attends à ce que la plupart des sommes soient réduites à un seul terme. Je suppose que vous savez que pour , est une variable aléatoire de Poisson avec le paramètre . α P { S 2 = α } = a 1 m + a 2 n = α P { X 1 = m } P { X 2 = n } = a 1 m + a 2 n = α exp ( - λ 1 m ) λ m 1S2αa1a2a1=a2=1S2λ1+λ2
P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!.
a1a2a1=a2=1S2λ1+λ2
Dilip Sarwate

Réponses:


5

À condition que peu de probabilités soient concentrées sur une seule valeur dans cette combinaison linéaire, il semble qu'une expansion de Cornish-Fisher puisse fournir de bonnes approximations du CDF (inverse).

Rappelons que cette expansion ajuste le CDF inverse de la distribution normale standard en utilisant les premiers cumulants de . Son asymétrie estβ 1S2β1

a13λ1+a23λ2(a12λ1+a22λ2)3

et son kurtosis estβ2

a14λ1+3a14λ12+a24λ2+6a12a22λ1λ2+3a24λ22(a12λ1+a22λ2)2.

Pour trouver le centile de la version normalisée de , calculezS 2αS2

wα=z+16β1(z21)+124(β23)(z23)z136β12z(2z25z)124(β23)β1(z45z2+2)

où est le centile de la distribution normale standard. Le centile de est ainsiα S 2zαS2

a1λ1+a2λ2+wαa12λ1+a22λ2.

Des expériences numériques suggèrent qu'il s'agit d'une bonne approximation une fois que et dépassent environ environ. Par exemple, considérons le cas et (arrangé pour donner une moyenne nulle pour plus de commodité):λ 2 5 λ 1 = 5 , λ 2 = 5 π / 2 , a 1 = π , a 2 = - 2λ1λ25λ1=5, λ2=5π/2, a1=π,a2=2

Figure

La partie ombrée en bleu est le CDF calculé numériquement de tandis que le rouge uni en dessous est l'approximation de Cornish-Fisher. L'approximation est essentiellement un lissage de la distribution réelle, ne montrant que de petits écarts systématiques.S2


2
Belle utilisation d'un outil souvent oublié ... et, bien sûr, pour ou ou plus, la méthode de convolution par force brute ne sera pas si pénible. λ 25λ1λ25
jbowman

1

Utilisez la convolution:

Soit Pour , sinon, et Pour , sinon.x10fX1(x1)=0fX2(x2)=λ x 2 e-λfX1(x1)=λx1eλx1!x10fX1(x1)=0x20fX2(x2)=0fX2(x2)=λx2eλx2!x20fX2(x2)=0

Soit , donc Le premier est appelé convolution.f Z ( z ) = - - f x 1 , x 2 ( z - x 2 , x 2 ) d x 1 d x 2Z=X1+X2X1=ZX2

fZ(z)=fx1,x2(zx2,x2)dx1dx2

Si et sont indépendants, cette façon, vous pouvez obtenir la distribution de la somme de deux variables aléatoires continues.X 2 f Z ( z ) = - - f X 1 ( z - x 2 ) f X 2 ( x 2 ) d x 1 d x 2X1X2

fZ(z)=fX1(zx2)fX2(x2)dx1dx2

Pour la distribution discrète de poisson Qui est aussi une distribution de Poisson avec le paramètre=e-(λ1+λ2)(λ1+λ2)z

fZ(z)=x2=0zλ1zx2eλ1(zx2)!λ2x2eλ2x2!
λ1+λ2
=e(λ1+λ2)(λ1+λ2)zz!
λ1+λ2

2
Cela semble répondre à une autre question: savoir comment ajouter deux distributions de Poisson. C'est le cas particulier (mais peut être étendu aux cas sans aucun problème). Mais que feriez-vous quand ? a 1 = a 2 a 1a 2a1=a2=1a1=a2a1a2
whuber

0

Je pense que la solution est le concept d'une distribution de Poisson composée. L'idée est une somme aléatoire avec une distribution de Poisson et et séquence indépendante de . Quand nous RESTRICTION au cas où toujours, alors nous pouvons décrire pour un nombre réel et une loi de Poisson . Vous obtenez le pgf par Pour la somme vous obtenez définir

S=i=1NXi
NXiiidNXi=kkNkN
E[skN]=E[(sk)N]=GN(sk)=exp(λ(sk1))
Z=k1N1+k2N2
GZ(s)=exp(λ1(sk11)+λ2(sk21)).
λ=λ1+λ2 puis l'interprétation finale est que le vr résultant est un composé distribution de Poisson avec une intensité et la distribution de la qui prennent la valeur avec une probabilité et la valeur avec .
GZ(s)=exp(λ(λ1λ(sk11)+λ2λ(sk11))=exp(λ(λ1λsk1+λ2λsk11)).
λ=λ1+λ2Xik1λ1/λk2λ2/λ

Après avoir prouvé que les distributions sont composées de Poisson, nous pouvons soit utiliser la récursion de Panjer dans le cas où et sont des entiers positifs. Ou nous pouvons facilement dériver la transformée de Fourier de la forme du pgf et récupérer la distribution par l'inverse. Notez qu'il existe une masse ponctuelle à .k1k20

Modifier après une discussion:

Je pense que le mieux que vous puissiez faire est MC. Vous pouvez utiliser la dérivation selon laquelle il s'agit d'une distribution de Poisson composée.

  1. échantillon N de (très efficace)Pois(λ)
  2. puis pour chaque échantillon que ce soit de ou où la probabilité du premier est . Pour ce faire, échantillonnez un RV de Bernoulli avec une probabilité de succès . S'il est à ajoutez à la somme échantillonnée, sinon ajoutez .i=1,,NX1X2λ1/λλ1/λ1k1k2

Vous aurez un échantillon de disons 100 000 en quelques secondes.

Alternativement, vous pouvez échantillonner séparément les deux sommets de votre représentation initiale ... ce sera aussi rapide.

Tout le reste (FFT) est compliqué si les facteurs constants k1 et k2 sont totalement généraux.


1
Et la distribution finale peut être trouvée par l'algorithme de Panjer si les facteurs sont des entiers.
Ric

Merci! Je suis arrivé à Cependant , à partir de cela, je voudrais trouver un moyen de pouvoir obtenir une sorte de distribution. Vous avez mentionné l'algorithme Panjer? Cependant, dans ce cas . @DilipSarwate Je viens de mentionner qu'il est impossible de simplifier ce qui suit pour généralement . GS2(z)=eλ1(za11)eλ2(za21)a1,a2R1un1,un2P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!,a1,a2
Michel

Salut Michel, j'ai édité ma réponse. Oui Panjer est d'une utilité limitée. Mais vous pouvez essayer une approche par transformée de Fourier. Cependant, les unités non entières sont problématiques ... Je dois réfléchir davantage à ce qu'il faut faire dans ce cas. Dans tous les cas, il est important de noter que le résultat est une distribution de Poisson composée (et non une distribution de Poisson "simple").
Ric

Salut Richard, merci pour ta mise à jour! Voulez-vous dire que je devrais essayer de calculer numériquement: ? Pr(S2=x)=12πReitxGS2(eit)dt
Michel

Quelque chose sur le chemin ... Si nous avions une distribution continue dont nous pouvons calculer la fonction caractéristique (comme vous le faites), alors cela conduit à un résultat rapide et agréable. Dans notre cas, j'ai besoin de plus de temps pour y réfléchir. Il devrait y avoir quelque chose de plus facile.
Ric
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.