J'ai presque les mêmes questions comme celle-ci: comment puis-je modéliser efficacement la somme des variables aléatoires de Bernoulli?
Mais le cadre est assez différent:
P ( X i = 1 ) = p i N p i , , ~ 20, ~ 0,1
Nous avons les données pour les résultats des variables aléatoires de Bernoulli: ,
Si nous estimons le avec une estimation du maximum de vraisemblance (et obtenons ), il s'avère que est beaucoup plus grand que attendue par les autres critères:pP { S = 3 } ( p M L E i ) P { S = 3 } ( p M L E i ) - P e x p e c t e d { S = 3 } ≈ 0,05
Ainsi, et ne peuvent pas être traités comme indépendants (ils ont une petite dépendance).
Il existe des contraintes comme celles-ci: et (connu), ce qui devrait aider à estimer .Σ s ≤ 2 P { S = s } = A P { S }
Comment pourrions-nous essayer de modéliser la somme des variables aléatoires de Bernoulli dans ce cas?
Quelle littérature pourrait être utile pour résoudre la tâche?
MISE À JOUR
Il y a d'autres idées:
(1) Il est possible de supposer que la dépendance inconnue entre commence après 1 ou plusieurs succès en série. Ainsi, lorsque , et . ∑ i = 1 , K X i >0 p K + 1 → p ′ K + 1 p ′ K + 1 < p K + 1
(2) Pour utiliser MLE, nous avons besoin du modèle le moins discutable. Voici une variante:
Σ i = 1 , k X i = 0 P { X 1 , . . . , X k , X k + 1 , . . . , X N si pour tout k if et , et pour tout k.∑ i = 1 , k - 1 X i = 0 X k = 1 P ′ { X k + 1 = 1 , X k + 2 = 1 ,
(3) Puisque nous ne nous intéressons qu'à nous pouvons définir (la probabilité de succès de pour N- (k + 1) +1 sommets de la queue). Et utilisez la paramétrisationP ' { X k + 1 , . . . , X N } ≈ P ″ { ∑ i = 1 , k X i = s ′ ; N - ( k + 1 ) + 1 = l } ∑ i = k + 1 , N X i P ″ { ∑
(4) Utiliser MLE pour le modèle basé sur les paramètres et avec pour (et tout ) et quelques autres contraintes natives .p 0 , 1 , p 1 , 1 ; p 0 , 2 , p 1 , 2 , p 2 , 2 ; . . . p s ′ , l = 0 s ′ ≥ 6 l
Est-ce que tout va bien avec ce plan?
MISE À JOUR 2
Quelques exemples de distribution empirique (rouge) par rapport à la distribution de Poisson (bleu) (les moyennes de poisson sont 2,22 et 2,45, les tailles d'échantillon sont 332 et 259):
Pour les échantillons (A1, A2) avec les moyens de poisson 2,28 et 2,51 (les tailles d'échantillon sont 303 et 249):
Pour le samlpe A1 + A2 joint (la taille de l'échantillon est de 552):
On dirait qu'une correction de Poisson devrait être le meilleur modèle :).