Quelle est la distribution de la moyenne arrondie des variables aléatoires de Poisson?

20

Si j'ai des variables aléatoires qui sont des distributions de Poisson avec les paramètres , quelle est la distribution de (c'est-à-dire le plancher entier de la moyenne)? $X_1,X_2,\ldots,X_n$ $\lambda_1, \lambda_2,\ldots, \lambda_n$ $Y=\left\lfloor\frac{\sum_{i=1}^n X_i}{n}\right\rfloor$

Une somme de Poissons est également Poisson, mais je ne suis pas assez confiant dans les statistiques pour déterminer s'il en est de même pour le cas ci-dessus.

poisson-distribution average

— Lubo Antonov
source

@amoeba J'ai annulé votre modification du titre car il ne s'agit pas en fait d'un "arrondi". Le montage précédent de Cardinal, bien que pas tout à fait aussi précis, semble préférable car il est précis.

— whuber

@whuber D'accord. J'hésitais lors de cette modification, mais j'ai décidé d'inclure le mot "arrondi" car actuellement le titre ne fait pas allusion à la principale difficulté ici (et est donc en quelque sorte trompeur). Le terme approprié devrait être "arrondi vers le bas", alors peut-être "Quelle est la distribution d'une moyenne de variables aléatoires de Poisson, arrondie vers le bas ?" - même si je dois admettre que cela semble un peu lourd.

— amibe dit Réintégrer Monica

@amoeba D'autres modifications sont bien sûr les bienvenues!

— whuber

27

Une généralisation de la question demande la distribution de $Y = \lfloor X/m \rfloor$ lorsque la distribution de $X$ est connue et appuyée sur les nombres naturels. (Dans la question, $X$ a une distribution de Poisson du paramètre $\lambda = \lambda_1 + \lambda_2 + \cdots + \lambda_n$ et $m=n$ .)

La distribution de $Y$ est facilement déterminé par la distribution de $mY$ , dont la fonction de génération probabilité (PGF) peut être déterminée en fonction de la PGF de $X$ . Voici un aperçu de la dérivation.

Écrivez pour le pgf de , où (par définition) . est construit à partir de de telle sorte que son pgf, , soit $p(x) = p_0 + p_1 x + \cdots + p_n x^n + \cdots$ $X$ $p_n = \Pr(X=n)$ $mY$ $X$ $q$

\begin{aligned} q (X) & = & (p_{0} + p_{1} + \dots + p_{m - 1}) + (p_{m} + p_{m + 1} + \dots + p_{2 m - 1}) X^{m} + \dots + \\ (p_{n m} + p_{n m + 1} + \dots + p_{(n + 1) m - 1}) X^{n m} + \dots . \end{aligned}

$\eqalign{q(x) &=& \left(p_0 + p_1 + \cdots + p_{m-1}\right) + \left(p_m + p_{m+1} + \cdots + p_{2m-1}\right)x^m + \cdots + \\&&\left(p_{nm} + p_{nm+1} + \cdots + p_{(n+1)m-1}\right)x^{nm} + \cdots.}$

Parce que cela converge absolument pour , nous pouvons réorganiser les termes en une somme de morceaux du formulaire $|x| \le 1$

D_{m, t} p (x) = p_{t} + p_{t + m} x^{m} + \dots + p_{t + n m} x^{n m} + \dots

$D_{m,t}p(x) = p_t + p_{t+m}x^m + \cdots + p_{t + nm}x^{nm} + \cdots$

pour . La série de puissance des fonctions constituée de chaque terme de la série de commençant par le : on parle parfois de décimation de . Les recherches Google ne fournissent actuellement pas beaucoup d'informations utiles sur les décimations, donc pour être complet, voici une dérivation d'une formule. $t=0, 1, \ldots, m-1$ $x^t D_{m,t}p$ $m^\text{th}$ $p$ $t^\text{th}$ $p$

Soit n'importe quelle racine primitive de l'unité; par exemple, prenez . Il résulte alors de et que $\omega$ $m^\text{th}$ $\omega = \exp(2 i \pi / m)$ $\omega^m=1$ $\sum_{j=0}^{m-1}\omega^j = 0$

x^{t} D_{m, t} p (x) = \frac{1}{m} \sum_{j = 0}^{m - 1} ω^{t j} p (x / ω^{j}) .

$x^t D_{m,t}p(x) = \frac{1}{m}\sum_{j=0}^{m-1} \omega^{t j} p(x/\omega^j).$

Pour voir cela, notez que l'opérateur est linéaire, il suffit donc de vérifier la formule sur la base . Appliquer le côté droit à donne $x^t D_{m,t}$ $\{1, x, x^2, \ldots, x^n, \ldots \}$ $x^n$

x^{t} D_{m, t} [x^{n}] = \frac{1}{m} \sum_{j = 0}^{m - 1} ω^{t j} x^{n} ω^{- n j} = \frac{x^{n}}{m} \sum_{j = 0}^{m - 1} ω^{(t - n) j .}

$x^t D_{m,t}[x^n] = \frac{1}{m}\sum_{j=0}^{m-1} \omega^{t j} x^n \omega^{-nj}= \frac{x^n}{m}\sum_{j=0}^{m-1} \omega^{(t-n) j.}$

Lorsque et diffèrent d'un multiple de , chaque terme de la somme est égal à et nous obtenons . Sinon, les termes parcourent les puissances de et ces sommes à zéro. D'où cet opérateur conserve toutes les puissances de congru à modulo et tue toutes les autres: c'est précisément la projection souhaitée. $t$ $n$ $m$ $1$ $x^n$ $\omega^{t-n}$ $x$ $t$ $m$

Une formule pour suit facilement en changeant l'ordre de sommation et en reconnaissant l'une des sommes comme géométrique, l'écrivant ainsi sous forme fermée: $q$

\begin{aligned} q (x) & = \sum_{t = 0}^{m - 1} (D_{m, t} [p]) (x) \\ = \sum_{t = 0}^{m - 1} x^{- t} \frac{1}{m} \sum_{j = 0}^{m - 1} ω^{t j} p (ω^{- j} x) \\ = \frac{1}{m} \sum_{j = 0}^{m - 1} p (ω^{- j} x) \sum_{t = 0}^{m - 1} {(ω^{j} / x)}^{t} \\ = \frac{x (1 - x^{- m})}{m} \sum_{j = 0}^{m - 1} \frac{p (ω^{- j} X)}{X - ω^{j}} . \end{aligned}

$\eqalign{ q(x) &= \sum_{t=0}^{m-1} (D_{m,t}[p])(x) \\ &= \sum_{t=0}^{m-1} x^{-t} \frac{1}{m} \sum_{j=0}^{m-1} \omega^{t j} p(\omega^{-j}x ) \\ &= \frac{1}{m} \sum_{j=0}^{m-1} p(\omega^{-j}x) \sum_{t=0}^{m-1} \left(\omega^j/x\right)^t \\ &= \frac{x(1-x^{-m})}{m} \sum_{j=0}^{m-1} \frac{p(\omega^{-j}x)}{x-\omega^j}. }$

Par exemple, le pgf d'une distribution de Poisson du paramètre est . Avec , et le pgf de sera $\lambda$ $p(x) = \exp(\lambda(x-1))$ $m=2$ $\omega=-1$ $2Y$

\begin{aligned} q (x) & = \frac{x (1 - x^{- 2})}{2} \sum_{j = 0}^{2 - 1} \frac{p ((- 1)^{- j} x)}{x - (- 1)^{j}} \\ = \frac{x - 1 / x}{2} (\frac{\exp (λ (x - 1))}{x - 1} + \frac{\exp (λ (- x - 1))}{x + 1}) \\ = \exp (- λ) (\frac{\sinh (λ x)}{x} + \cosh (λ x)) . \end{aligned}

$\eqalign{ q(x) &= \frac{x(1-x^{-2})}{2} \sum_{j=0}^{2-1} \frac{p((-1)^{-j}x)}{x-(-1)^j} \\ &= \frac{x-1/x}{2} \left(\frac{\exp(\lambda(x-1))}{x-1} + \frac{\exp(\lambda(-x-1))}{x+1}\right) \\ &= \exp(-\lambda) \left(\frac{\sinh (\lambda x)}{x}+\cosh (\lambda x)\right). }$

Une utilisation de cette approche est de calculer les moments de et . La valeur de la dérivée du pgf évalué à est le moment factoriel . Le moment est une combinaison linéaire des premiers moments factoriels. En utilisant ces observations, nous trouvons, par exemple, que pour un Poisson distribué , sa moyenne (qui est le premier moment factoriel) est égale à , la moyenne de est égal à , et la moyenne de est égale à $X$ $mY$ $k^\text{th}$ $x=1$ $k^\text{th}$ $k^\text{th}$ $k$ $X$ $\lambda$ $2\lfloor(X/2)\rfloor$ $\lambda- \frac{1}{2} + \frac{1}{2} e^{-2\lambda}$ $3\lfloor(X/3)\rfloor$ $\lambda -1+e^{-3 \lambda /2} \left(\frac{\sin \left(\frac{\sqrt{3} \lambda }{2}\right)}{\sqrt{3}}+\cos \left(\frac{\sqrt{3} \lambda}{2}\right)\right)$ :

Veux dire

Les moyennes pour sont affichées en bleu, rouge et jaune, respectivement, en fonction de : asymptotiquement, la moyenne diminue de par rapport à la moyenne de Poisson d'origine. $m=1,2,3$ $\lambda$ $(m-1)/2$

Des formules similaires pour les variances peuvent être obtenues. (Ils deviennent désordonnés lorsque augmente et sont donc omis. Une chose qu'ils établissent définitivement est que lorsque aucun multiple de n'est Poisson: il n'a pas l'égalité caractéristique de moyenne et de variance) Voici un tracé des variances en fonction de pour : $m$ $m \gt 1$ $Y$ $\lambda$ $m=1,2,3$

Écarts

Il est intéressant de noter que pour des valeurs plus élevées de les variances augmentent . Intuitivement, cela est dû à deux phénomènes concurrents: la fonction de plancher consiste en fait à regrouper des groupes de valeurs qui étaient à l'origine distinctes; cela doit entraîner une diminution de la variance . En même temps, comme nous l'avons vu, les moyens changent aussi (car chaque bac est représenté par sa plus petite valeur); cela doit entraîner l'ajout d'un terme égal au carré de la différence de moyennes. L'augmentation de la variance pour les grands devient plus grande avec des valeurs plus élevées de . $\lambda$ $\lambda$ $m$

Le comportement de la variance de avec est étonnamment complexe. Terminons par une simulation rapide (in ) montrant ce qu'elle peut faire. Les graphiques montrent la différence entre la variance de et la variance de pour Poisson distribué avec différentes valeurs de allant de à . Dans tous les cas, les parcelles semblent avoir atteint leurs valeurs asymptotiques à droite. $mY$ $m$ R $m\lfloor X/m \rfloor$ $X$ $X$ $\lambda$ $1$ $5000$

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

Parcelles

— whuber
source

1

C'est une excellente réponse! Il me faudra probablement un peu de temps pour digérer :)

— Lubo Antonov

1

et c'est pourquoi j'ai dit "Utiliser la fonction de plancher ... affecte aussi légèrement la variance mais de manière plus compliquée."

— Henry

1

+1 Merci pour la réponse détaillée. Il existe certainement des façons compliquées dans lesquelles la fonction de plancher affecte la variance.

— Dilip Sarwate

1

+1 pour la simulation en R avec du code --- c'est un très bel exemple d'utilisation sapply()pour la simulation. Merci.

— Assad Ebrahim

1

@Roberto Merci. Cependant, la distinction entre " " et " ", étant purement une question de notation, est tout à fait triviale et n'a aucune importance mathématique ou statistique.

x

$x$

s

$s$

— whuber

12

Comme le dit Michael Chernick, si les variables aléatoires individuelles sont indépendantes, la somme est Poisson avec le paramètre (moyenne et variance) que vous pourriez appeler . $\sum_{i=1}^{n} \lambda_i$ $\lambda$

La division par réduit la moyenne à et la variance sorte que la variance sera inférieure à la distribution de Poisson équivalente. Comme Michael le dit, toutes les valeurs ne seront pas des entiers. $n$ $\lambda / n$ $\lambda / n^2$

L'utilisation de la fonction de plancher réduit légèrement la moyenne, d'environ , et affecte légèrement la variance mais de manière plus compliquée. Bien que vous ayez des valeurs entières, la variance sera toujours sensiblement inférieure à la moyenne et vous aurez donc une distribution plus étroite que le Poisson. $\frac12 -\frac{1}{2n}$

— Henri
source

merci, pas un résultat que je peux utiliser, mais au moins je sais maintenant :)

— Lubo Antonov

Si les lambdas ne sont pas tous égaux, le résultat ne devrait-il pas ressembler davantage à un binôme négatif qu'à un Poisson (en ignorant pour l'instant la partie non entière)? Qu'est-ce que j'oublie ici?

— gung - Rétablir Monica

2

@gung: Il vous manque le point que l'individu n'affecte que la distribution à travers leur somme et combien il y en a. Peu importe les valeurs particulières qu'ils prennent: donnera le même résultat que .

λ_{i}

$\lambda_i$

λ_{1} = 1, λ_{2} = 2, λ_{3} = 9

$\lambda_1=1, \lambda_2=2, \lambda_3=9$

λ_{1} = 4, λ_{2} = 4, λ_{3} = 4

$\lambda_1=4, \lambda_2=4, \lambda_3=4$

— Henry

10

La fonction de masse de probabilité de la moyenne de variables aléatoires de Poisson indépendantes peut être écrite explicitement, bien que la réponse ne vous aide pas beaucoup. Comme Michael Chernick l'a noté dans les commentaires sur sa propre réponse, la somme des variables aléatoires de Poisson indépendantes avec les paramètres respectifs est une variable aléatoire de Poisson avec le paramètre . Par conséquent, Ainsi, est une variable aléatoire prenant la valeur avec probabilité $n$ $\sum_i X_i$ $X_i$ $\lambda_i$ $\lambda = \sum_i \lambda_i$

P {\sum_{i = 1}^{n} X_{i} = k} = \exp (- λ) \frac{λ^{k}}{k!}, k = 0, 1, 2, \dots,

$P\left\{ \sum_{i=1}^n X_i= k\right\} = \exp(-\lambda)\frac{\lambda^k}{k!}, ~~ k = 0, 1, 2, \ldots,$

\hat{Y} = n^{- 1} \sum_{i = 1}^{n} X_{i}

$\hat{Y} = n^{-1} \sum_{i=1}^n X_i$

k / n

$k/n$

\exp (- λ) \frac{λ^{k}}{k!}

$\exp(-\lambda)\frac{\lambda^k}{k!}$ . Notez que n'est pas une variable aléatoire à valeur entière (bien qu'elle prenne des valeurs rationnelles uniformément espacées). Il s'ensuit facilement que est une variable aléatoire à valeur entière prenant la valeur avec une probabilité Ce n'est pas

\hat{Y}

$\hat{Y}$

Y = ⌊ \hat{Y} ⌋

$Y = \lfloor \hat{Y} \rfloor$

m

$m$

P {Y = m} = P {⌊ \frac{1}{n} \sum_{i = 1}^{n} X_{i} ⌋ = m} = \exp (- λ) \sum_{i = 0}^{n - 1} \frac{λ^{m n + i}}{(m n + i)!}, m = 0, 1, 2, \dots,

$P\{Y = m\} = P\left\{\left\lfloor \frac{1}{n}\sum_{i=1}^n X_i \right\rfloor = m\right\} = \exp(-\lambda)\sum_{i=0}^{n-1}\frac{\lambda^{mn+i}}{(mn+i)!}, ~~ m = 0, 1, 2, \ldots,$ la fonction de masse de probabilité d'une variable aléatoire de Poisson. Les formules pour la moyenne et la variance peuvent être écrites en utilisant cette fonction de masse de probabilité, mais elles ne conduisent évidemment pas à de belles réponses simples en termes de et . Des valeurs approximatives peuvent être obtenues comme l'a souligné Henry.

λ

$\lambda$

n

$n$

— Dilip Sarwate
source

1 Il sont des formules fermées pour les moments de , bien que.

Y

$Y$

— whuber

Merci pour la formulation rigoureuse! Y a-t-il une chance que vous aimeriez essayer les formules de moyenne et de variance?

— Lubo Antonov

2

Peut-être que @whuber affichera un lien (ou une citation d'un livre ou d'un article de journal) où les formules fermées pour les moments peuvent être trouvées, ou écrira une réponse donnant les formules elles-mêmes, avec ou sans dérivation détaillée.

— Dilip Sarwate

@Dilip Ma réclamation concernant les formules fermées ne reposait sur rien de publié, j'ai donc posté une réponse séparée indiquant ce que j'avais en tête et comment cela pourrait être utilisé pour comprendre cette situation.

— whuber

3

Y ne sera pas Poisson. Notez que les variables aléatoires de Poisson prennent des valeurs entières non négatives. Une fois que vous avez divisé par une constante, vous créez une variable aléatoire qui peut avoir des valeurs non entières. Il aura toujours la forme du Poisson. C'est juste que les probabilités discrètes peuvent se produire à des points non entiers.

— Michael R. Chernick
source

Y

$Y$

@ lucas1024 Je ne pense pas, mais je ne suis pas sûr.

— Michael R. Chernick

\sum X_{i}

$\sum X_i$

n^{- 1}

$n^{-1}$

@JDav La somme est Poisson avec le paramètre de taux égal à la somme des paramètres de taux individuels. Mais l'OP évolue de 1 / n et veut ensuite tronquer le entier juste en dessous de Y. Je ne sais pas exactement ce que cela fait à la distribution.

— Michael R. Chernick

Mon commentaire précédent supposait l'indépendance.

— Michael R. Chernick