Une généralisation de la question demande la distribution de Y=⌊X/m⌋ lorsque la distribution de X est connue et appuyée sur les nombres naturels. (Dans la question, X a une distribution de Poisson du paramètre λ=λ1+λ2+⋯+λn et m=n .)
La distribution de Y est facilement déterminé par la distribution de mY , dont la fonction de génération probabilité (PGF) peut être déterminée en fonction de la PGF de X . Voici un aperçu de la dérivation.
Écrivez pour le pgf de , où (par définition) . est construit à partir de de telle sorte que son pgf, , soitp(x)=p0+p1x+⋯+pnxn+⋯Xpn=Pr(X=n)mYXq
q( x )=( p0+ p1+ ⋯ + pm - 1) + ( pm+ pm + 1+ ⋯ + p2 m - 1) xm+⋯ +( pn m+pn m + 1+ ⋯ +p( n + 1 ) m - 1)xnm+ ⋯ .
Parce que cela converge absolument pour , nous pouvons réorganiser les termes en une somme de morceaux du formulaire| x | ≤ 1
rém , tp ( x ) = pt+ pt + mXm+ ⋯ + pt+nmxnm+⋯
pour . La série de puissance des fonctions constituée de chaque terme de la série de commençant par le : on parle parfois de décimation de . Les recherches Google ne fournissent actuellement pas beaucoup d'informations utiles sur les décimations, donc pour être complet, voici une dérivation d'une formule.x t D m , t p m th p t tht=0,1,…,m−1xtDm,tpmthptthp
Soit n'importe quelle racine primitive de l'unité; par exemple, prenez . Il résulte alors de et quem th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1∑m−1j=0ωj=0
xtDm,tp(x)=1m∑j=0m−1ωtjp(x/ωj).
Pour voir cela, notez que l'opérateur est linéaire, il suffit donc de vérifier la formule sur la base . Appliquer le côté droit à donne { 1 , x , x 2 , … , x n , … } x nxtDm,t{1,x,x2,…,xn,…}xn
xtDm,t[xn]=1m∑j=0m−1ωtjxnω−nj=xnm∑j=0m−1ω(t−n)j.
Lorsque et diffèrent d'un multiple de , chaque terme de la somme est égal à et nous obtenons . Sinon, les termes parcourent les puissances de et ces sommes à zéro. D'où cet opérateur conserve toutes les puissances de congru à modulo et tue toutes les autres: c'est précisément la projection souhaitée.tnm1xnωt−nxtm
Une formule pour suit facilement en changeant l'ordre de sommation et en reconnaissant l'une des sommes comme géométrique, l'écrivant ainsi sous forme fermée:q
q(x)=∑t=0m−1(Dm,t[p])(x)=∑t=0m−1x−t1m∑j=0m−1ωtjp(ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Par exemple, le pgf d'une distribution de Poisson du paramètre est . Avec , et le pgf de seraλp ( x ) = exp( λ ( x - 1 ) )m = 2ω = - 12 Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Une utilisation de cette approche est de calculer les moments de et . La valeur de la dérivée du pgf évalué à est le moment factoriel . Le moment est une combinaison linéaire des premiers moments factoriels. En utilisant ces observations, nous trouvons, par exemple, que pour un Poisson distribué , sa moyenne (qui est le premier moment factoriel) est égale à , la moyenne de est égal à , et la moyenne de est égale àXmYkthx=1kthkthkXλ2⌊(X/2)⌋λ−12+12e−2λ3⌊(X/3)⌋λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Les moyennes pour sont affichées en bleu, rouge et jaune, respectivement, en fonction de : asymptotiquement, la moyenne diminue de par rapport à la moyenne de Poisson d'origine.m=1,2,3λ(m−1)/2
Des formules similaires pour les variances peuvent être obtenues. (Ils deviennent désordonnés lorsque augmente et sont donc omis. Une chose qu'ils établissent définitivement est que lorsque aucun multiple de n'est Poisson: il n'a pas l'égalité caractéristique de moyenne et de variance) Voici un tracé des variances en fonction de pour :mm>1Yλm=1,2,3
Il est intéressant de noter que pour des valeurs plus élevées de les variances augmentent . Intuitivement, cela est dû à deux phénomènes concurrents: la fonction de plancher consiste en fait à regrouper des groupes de valeurs qui étaient à l'origine distinctes; cela doit entraîner une diminution de la variance . En même temps, comme nous l'avons vu, les moyens changent aussi (car chaque bac est représenté par sa plus petite valeur); cela doit entraîner l'ajout d'un terme égal au carré de la différence de moyennes. L'augmentation de la variance pour les grands devient plus grande avec des valeurs plus élevées de .λλm
Le comportement de la variance de avec est étonnamment complexe. Terminons par une simulation rapide (in ) montrant ce qu'elle peut faire. Les graphiques montrent la différence entre la variance de et la variance de pour Poisson distribué avec différentes valeurs de allant de à . Dans tous les cas, les parcelles semblent avoir atteint leurs valeurs asymptotiques à droite.mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})