La présente question est un cas spécifique où vous avez affaire à une quantité qui est une fonction linéaire d'une variable aléatoire multinomiale. Il est possible de résoudre votre problème exactement en énumérant les combinaisons multinomiales qui satisfont l'inégalité requise et en additionnant la distribution sur cette plage. Dans le cas où est grand, cela peut devenir impossible à calculer. Dans ce cas, il est possible d'obtenir une distribution approximative en utilisant l'approximation normale au multinomial. Une version généralisée de cette approximation est présentée ci-dessous, puis elle est appliquée à votre exemple spécifique.N
Problème général d'approximation: Supposons que nous ayons une séquence de variables aléatoires échangeables de gamme . Pour tout nous pouvons former le vecteur de comptage , qui compte le nombre de apparitions de chaque résultat dans les premières valeurs de la séquence. Puisque la séquence sous-jacente est échangeable, le vecteur de comptage est distribué comme suit:n ∈ N1,2,...,mn∈NnX≡X(n)≡(X1,X2,...,Xm)n
X ~ Mu(n,θ)θ=limn→∞X(n)/n.
Supposons maintenant que nous ayons un vecteur de poids non négatifs et que nous utilisons ces poids pour définir la fonction linéaire:w=(w1,w2,...,wm)
A(n)≡∑i=1mwiXi.
Puisque les poids ne sont pas négatifs, cette nouvelle quantité n'est pas décroissante en . Nous définissons ensuite le nombre , qui est le plus petit nombre d'observations nécessaires pour obtenir une valeur minimale spécifiée pour notre fonction linéaire. Nous voulons approximer la distribution de dans le cas où cette valeur est (stochastiquement) grande.N ( a ) ≡ min { n ∈ N | A ( n ) ⩾ a } N ( a )nN(a)≡min{n∈N|A(n)⩾a}N(a)
Résoudre le problème général d'approximation: Premièrement, nous notons que puisque n'est pas décroissant dans (qui tient parce que nous avons supposé que tous les poids sont non négatifs), nous avons:nA(n)n
P(N(a)⩾n)=P(N(a)>n−1)=P(A(n−1)<a).
Par conséquent, la distribution de est directement lié à la distribution de . En supposant que la première quantité est grande, nous pouvons approximer la distribution de cette dernière en remplaçant le vecteur aléatoire discret par une approximation continue de la distribution normale multivariée. Cela conduit à une approximation normale pour la quantité linéaire , et nous pouvons calculer directement les moments de cette quantité. Pour ce faire, nous utilisons le fait que , et pour . Avec une algèbre de base, cela nous donne:A X A ( n ) E ( X i ) = n θ i V ( X i ) = n θ i ( 1 - θ i ) C ( X i , X j ) = - n θ i θ j i ≠ jNAXA(n)E(Xi)=nθiV(Xi)=nθi(1−θi)C(Xi,Xj)=−nθiθji≠j
μ≡E(1nA(n))=∑i=1mwiθi,
σ2≡V(1n−−√A(n))=∑i=1mwiθi−(∑i=1mwiθi)2=μ(1−μ).
Prendre l'approximation normale du multinomial nous donne maintenant la distribution approximative . L'application de cette approximation donne:A(n) ~ N(nμ,nμ(1−μ))
P(N(a)⩾n)=P(A(n−1)<a)≈Φ(a−(n−1)μ(n−1)μ(1−μ)−−−−−−−−−−−−−√).
(Le symbole est la notation standard pour la fonction de distribution normale standard.) Il est possible d'appliquer cette approximation pour trouver des probabilités relatives à la quantité pour une valeur spécifiée de . Il s'agit d'une approximation de base qui n'a pas tenté d'incorporer une correction de continuité sur les valeurs des valeurs de comptage multinomiales sous-jacentes. Il est obtenu en prenant une approximation normale en utilisant les mêmes deux premiers moments centraux que la fonction linéaire exacte.N ( a ) aΦN(a)a
Application à votre problème: dans votre problème, vous avez des probabilités , poids , et valeur de coupure . Vous avez donc (arrondi à six décimales) . En appliquant l'approximation ci-dessus, nous avons (arrondi à six décimales):w=(0,ln2,ln3)a=ln100000μ=1θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729
P(N(a)⩾25)≈Φ(ln100000−24⋅0.48172924−−√⋅0.499666)=Φ(−0.019838)=0.492086.
En appliquant la distribution multinomiale exacte, en additionnant toutes les combinaisons satisfaisant à l'exigence , on peut montrer que le résultat exact est . Par conséquent, nous pouvons voir que l'approximation est assez proche de la réponse exacte dans le cas présent.P ( N ( a ) ⩾ 25 ) = 0,483500P(A(24)<a)P(N(a)⩾25)=0.483500
J'espère que cette réponse vous donnera une réponse à votre question spécifique, tout en la plaçant dans un cadre plus général de résultats probabilistes qui s'appliquent aux fonctions linéaires des vecteurs aléatoires multinomiaux. La présente méthode devrait vous permettre d'obtenir des solutions approximatives aux problèmes du type général auquel vous êtes confronté, permettant une variation des nombres spécifiques dans votre exemple.