Vous ne pouvez pas utiliser la représentation linéaire de la corrélation dans des distributions de support discrètes.
Dans le cas particulier de la distribution binomiale, la représentation
X=∑i=18δiY=∑i=118γiδi,γi∼B(1,2/3)
peut être exploitée car
cov(X,Y)=∑i=18∑j=118cov(δi,γj)
Si nous choisissons certains des
δidoit être égal à certains des
γjet générés indépendamment autrement, nous obtenons
cov(X,Y)=∑i=18∑j=118I(δi:=γj)var(γj)
où la notation
I(δi:=γj) indique que
δi est choisi identique à
γj plutôt que généré comme Bernoulli
B(1,2/3).
Puisque la contrainte est
cov(X,Y)=0.5×8×18−−−−−√×23×13
nous devons résoudre
∑i=18∑j=118I(δi:=γj)=0.5×8×18−−−−−√=6
Cela signifie que si nous choisissons 6 des 8
δiest égal à 6 des 18
γjnous devrions obtenir cette corrélation de 0,5.
L'implémentation se déroule comme suit:
- produire Z∼B(6,2/3), Y1∼B(12,2/3), X1∼B(2,2/3);
- Prend X=Z+Z1 et Y=Z+Y1
On peut vérifier ce résultat avec une simulation R
> z=rbinom(10^8,6,.66)
> y=z+rbinom(10^8,12,.66)
> x=z+rbinom(10^8,2,.66)
cor(x,y)
> cor(x,y)
[1] 0.5000539
Commentaire
Il s'agit d'une solution plutôt artificielle au problème en ce qu'elle ne fonctionne que parce que 8×18 est un carré parfait et parce que cor(X,Y)×8×18−−−−−√est un entier. Pour d'autres corrélations acceptables, une randomisation serait nécessaire, c'est-à-direI(δi:=γj) serait zéro ou un avec une certaine probabilité ϱ.
Addenda
Le problème a été proposé et résolu il y a des années sur Stack Overflow avec la même idée de partager Bernoullis.