Les diapositives auxquelles vous liez sont quelque peu déroutantes, omettant des étapes et faisant quelques fautes de frappe, mais elles sont finalement correctes. Cela aidera à répondre à la question 2 d'abord, puis à 1, et enfin à dériver la transformation de symétrisationA(u)=∫u−∞1[V(θ)]1/3dθA(u)=∫u−∞1[V(θ)]1/3dθ .
Question 2. Nous analysons car c'est la moyenne d'un échantillon de taille de iid variables aléatoires . C'est une quantité importante car l'échantillonnage de la même distribution et la prise de la moyenne se produisent tout le temps en science. Nous voulons savoir à quel point est proche de la vraie moyenne . Le théorème de la limite centrale dit qu'il convergera vers comme mais nous aimerions connaître la variance et l'asymétrie deˉXX¯NNX1,...,XNX1,...,XNˉXX¯μμμμN→∞N→∞ˉXX¯ .
Question 1. Votre approximation de la série Taylor n'est pas incorrecte, mais nous devons faire attention à garder une trace de vs et des puissances de pour arriver à la même conclusion que les diapositives. Nous allons commencer avec les définitions de et les moments centraux de et dériver la formule pour :ˉXX¯XiXiNNˉXX¯XiXiκ3(h(ˉX))κ3(h(X¯))
ˉX=1N∑Ni=1XiX¯=1N∑Ni=1Xi
E[Xi]=μE[Xi]=μ
V(Xi)=E[(Xi−μ)2]=σ2V(Xi)=E[(Xi−μ)2]=σ2
κ3(Xi)=E[(Xi−μ)3]κ3(Xi)=E[(Xi−μ)3]
Maintenant, les moments centraux de :ˉXX¯
E[ˉX]=1N∑Ni=1E[Xi]=1N(Nμ)=μE[X¯]=1N∑Ni=1E[Xi]=1N(Nμ)=μ
V(ˉX)=E[(ˉX−μ)2]=E[((1NN∑i=1Xi)−μ)2]=E[(1NN∑i=1(Xi−μ))2]=1N2(NE[(Xi−μ)2]+N(N−1)E[Xi−μ]E[Xj−μ])=1Nσ2V(X¯)=E[(X¯−μ)2]=E[((1N∑i=1NXi)−μ)2]=E[(1N∑i=1N(Xi−μ))2]=1N2(NE[(Xi−μ)2]+N(N−1)E[Xi−μ]E[Xj−μ])=1Nσ2
La dernière étape suit puisque , et . Cela n'a peut-être pas été la dérivation la plus simple de , mais c'est le même processus que nous devons faire pour trouver et , où nous décomposons un produit d'une sommation et comptons le nombre de termes avec des puissances de variables différentes. Dans le cas ci-dessus, il y avait termes qui étaient de la forme et termes de la forme .E[Xi−μ]=0E[Xi−μ]=0E[(Xi−μ)2]=σ2E[(Xi−μ)2]=σ2V(ˉX)V(X¯)κ3(ˉX)κ3(X¯)κ3(h(ˉX))κ3(h(X¯))NN(Xi−μ)2(Xi−μ)2N(N−1)N(N−1)(Xi−μ)(Xj−μ)(Xi−μ)(Xj−μ)
κ3(ˉX)=E[(ˉX−μ)3)]=E[((1NN∑i=1Xi)−μ)3]=E[(1NN∑i=1(Xi−μ))3]=1N3(NE[(Xi−μ)3]+3N(N−1)E[(Xi−μ)E[(Xj−μ)2]+N(N−1)(N−2)E[(Xi−μ)]E[(Xj−μ)]E[(Xk−μ)]=1N2E[(Xi−μ)3]=κ3(Xi)N2κ3(X¯)=E[(X¯−μ)3)]=E[((1N∑i=1NXi)−μ)3]=E[(1N∑i=1N(Xi−μ))3]=1N3(NE[(Xi−μ)3]+3N(N−1)E[(Xi−μ)E[(Xj−μ)2]+N(N−1)(N−2)E[(Xi−μ)]E[(Xj−μ)]E[(Xk−μ)]=1N2E[(Xi−μ)3]=κ3(Xi)N2
Ensuite, nous développeronsh(ˉX)h(X¯) dans une série Taylor comme vous l'avez:
h(ˉX)=h(μ)+h′(μ)(ˉX−μ)+12h″(μ)(ˉX−μ)2+13h‴(μ)(ˉX−μ)3+...h(X¯)=h(μ)+h′(μ)(X¯−μ)+12h′′(μ)(X¯−μ)2+13h′′′(μ)(X¯−μ)3+...
E[h(ˉX)]=h(μ)+h′(μ)E[ˉX−μ]+12h″(μ)E[(ˉX−μ)2]+13h‴(μ)E[(ˉX−μ)3]+...=h(μ)+12h″(μ)σ2N+13h‴(μ)κ3(Xi)N2+...E[h(X¯)]=h(μ)+h′(μ)E[X¯−μ]+12h′′(μ)E[(X¯−μ)2]+13h′′′(μ)E[(X¯−μ)3]+...=h(μ)+12h′′(μ)σ2N+13h′′′(μ)κ3(Xi)N2+...
Avec un peu plus d'efforts, vous pouvez prouver que les autres termes sont . Enfin, puisque , (qui n'est pas la même chose que ), nous faisons à nouveau un calcul similaire:O(N−3)O(N−3)κ3(h(ˉX))=E[(h(ˉX)−E[h(ˉX)])3]κ3(h(X¯))=E[(h(X¯)−E[h(X¯)])3]E[(h(ˉX)−h(μ))3]E[(h(X¯)−h(μ))3]
κ3(h(ˉX))=E[(h(ˉX)−E[h(ˉX)])3]=E[(h(μ)+h′(μ)(ˉX−μ)+12h″(μ)(ˉX−μ)2+O((ˉX−μ)3)−h(μ)−12h″(μ)σ2N−O(N−2))3]κ3(h(X¯))=E[(h(X¯)−E[h(X¯)])3]=E[(h(μ)+h′(μ)(X¯−μ)+12h′′(μ)(X¯−μ)2+O((X¯−μ)3)−h(μ)−12h′′(μ)σ2N−O(N−2))3]
Nous ne sommes intéressés que par les termes résultant de l'ordre , et avec un travail supplémentaire, vous pourriez montrer que vous n'avez pas besoin des termes " "ou" "avant de prendre le troisième pouvoir, car ils ne résulteront qu'en termes d'ordreO(N−2)O(N−2)O((ˉX−μ)3)O((X¯−μ)3)−O(N−2)−O(N−2)O(N−3)O(N−3) . Donc, en simplifiant, nous obtenons
κ3(h(ˉX))=E[(h′(μ)(ˉX−μ)+12h″(μ)(ˉX−μ)2−12h″(μ)σ2N))3]=E[h′(μ)3(ˉX−μ)3+18h″(μ)3(ˉX−μ)6−18h″(μ)3σ6N3+32h′(μ)2h″(μ)(ˉX−μ)4+34h′(μ)h″(μ)(ˉX−μ)5−32h′(μ)2h″(μ)(ˉX−μ)2σ2N+O(N−3)]κ3(h(X¯))=E[(h′(μ)(X¯−μ)+12h′′(μ)(X¯−μ)2−12h′′(μ)σ2N))3]=E[h′(μ)3(X¯−μ)3+18h′′(μ)3(X¯−μ)6−18h′′(μ)3σ6N3+32h′(μ)2h′′(μ)(X¯−μ)4+34h′(μ)h′′(μ)(X¯−μ)5−32h′(μ)2h′′(μ)(X¯−μ)2σ2N+O(N−3)]
J'ai laissé des termes qui étaient évidemment dans ce produit. Vous devrez vous convaincre que les termes et sontO(N−3)O(N−3)E[(ˉX−μ)5]E[(X¯−μ)5]E[(ˉX−μ)6]E[(X¯−μ)6]O(N−3)O(N−3) également. cependant,
E[(ˉX−μ)4]=E[1N4(N∑i=1(ˉX−μ))4]=1N4(NE[(Xi−μ)4]+3N(N−1)E[(Xi−μ)2]E[(Xj−μ)2]+0)=3N2σ4+O(N−3)E[(X¯−μ)4]=E[1N4(∑i=1N(X¯−μ))4]=1N4(NE[(Xi−μ)4]+3N(N−1)E[(Xi−μ)2]E[(Xj−μ)2]+0)=3N2σ4+O(N−3)
Puis distribuer l'espérance sur notre équation pourκ3(h(ˉX))κ3(h(X¯)) , nous avons
κ3(h(ˉX))=h′(μ)3E[(ˉX−μ)3]+32h′(μ)2h″(μ)E[(ˉX−μ)4]−32h′(μ)2h″(μ)E[(ˉX−μ)2]σ2N+O(N−3)=h′(μ)3κ3(Xi)N2+92h′(μ)2h″(μ)σ4N2−32h′(μ)2h″(μ)σ4N2+O(N−3)=h′(μ)3κ3(Xi)N2+3h′(μ)2h″(μ)σ4N2+O(N−3)κ3(h(X¯))=h′(μ)3E[(X¯−μ)3]+32h′(μ)2h′′(μ)E[(X¯−μ)4]−32h′(μ)2h′′(μ)E[(X¯−μ)2]σ2N+O(N−3)=h′(μ)3κ3(Xi)N2+92h′(μ)2h′′(μ)σ4N2−32h′(μ)2h′′(μ)σ4N2+O(N−3)=h′(μ)3κ3(Xi)N2+3h′(μ)2h′′(μ)σ4N2+O(N−3)
Ceci conclut la dérivation de . Maintenant, nous dériverons enfin la transformée de symétrisation .κ3(h(ˉX))κ3(h(X¯))A(u)=∫u−∞1[V(θ)]1/3dθA(u)=∫u−∞1[V(θ)]1/3dθ
Pour cette transformation, il est important que soit issu d'une distribution de famille exponentielle, et en particulier d'une famille exponentielle naturelle (ou il a été transformé en cette distribution), de la formeXiXifXi(x;θ)=h(x)exp(θx−b(θ))fXi(x;θ)=h(x)exp(θx−b(θ))
Dans ce cas, les cumulants de la distribution sont donnés par . Donc , et . Nous pouvons écrire le paramètre en fonction de prenant simplement l'inverse de , en écrivant . alorsκk=b(k)(θ)κk=b(k)(θ)μ=b′(θ)μ=b′(θ)σ2=V(θ)=b″(θ)σ2=V(θ)=b′′(θ)κ3=b‴(θ)κ3=b′′′(θ)θθμμb′b′θ(μ)=(b′)−1(μ)θ(μ)=(b′)−1(μ)
θ′(μ)=1b″((b′)−1(μ))=1b″(θ))=1σ2θ′(μ)=1b′′((b′)−1(μ))=1b′′(θ))=1σ2
Ensuite, nous pouvons écrire la variance en fonction de , et appeler cette fonctionμμˉVV¯ :
ˉV(μ)=V(θ(μ))=b″(θ(μ))V¯(μ)=V(θ(μ))=b′′(θ(μ))
alors
ddμˉV(μ)=V′(θ(μ))θ′(μ)=b‴(θ)1σ2=κ3σ2ddμV¯(μ)=V′(θ(μ))θ′(μ)=b′′′(θ)1σ2=κ3σ2
Donc, en fonction de ,μμκ3(μ)=ˉV′(μ)ˉV(μ)κ3(μ)=V¯′(μ)V¯(μ) .
Maintenant, pour la transformation de symétrisation, nous voulons réduire l'asymétrie de en faisant pour que soit . Ainsi, nous voulonsh(ˉX)h(X¯)h′(μ)3κ3(Xi)N2+3h′(μ)2h″(μ)σ4N2=0h′(μ)3κ3(Xi)N2+3h′(μ)2h′′(μ)σ4N2=0h(ˉX)h(X¯)O(N−3)
h′(μ)3κ3(Xi)+3h′(μ)2h″(μ)σ4=0
En substituant nos expressions à et tant que fonctions de , nous avons:σ2κ3μ
h′(μ)3ˉV′(μ)ˉV(μ)+3h′(μ)2h″(μ)ˉV(μ)2=0
Donc , conduisant à .h′(μ)3ˉV′(μ)+3h′(μ)2h″(μ)ˉV(μ)=0ddμ(h′(μ)3ˉV(μ))=0
Une solution à cette équation différentielle est:
h′(μ)3ˉV(μ)=1 ,
h′(μ)=1[ˉV(μ)]1/3
Donc, , pour toute constante, . Cela nous donne la transformation symétrisante , où est la variance comme fonction de la moyenne dans une famille exponentielle naturelle.h(μ)=∫μc1[ˉV(θ)]1/3dθcA(u)=∫u−∞1[V(θ)]1/3dθV