Il n'y a pas de solution unique
Je ne pense pas que la vraie distribution de probabilité discrète puisse être récupérée, sauf si vous faites des hypothèses supplémentaires. Votre situation est essentiellement un problème de récupération de la distribution conjointe des marginaux. Il est parfois résolu en utilisant des copules dans l'industrie, par exemple la gestion des risques financiers, mais généralement pour des distributions continues.
Présence, indépendant, AS 205
En cas de problème de présence, pas plus d'une bombe n'est autorisée dans une cellule. Encore une fois, pour le cas particulier de l'indépendance, il existe une solution de calcul relativement efficace.
Si vous connaissez FORTRAN, vous pouvez utiliser ce code qui implémente l'algorithme AS 205: Ian Saunders, l'algorithme AS 205: énumération des tables R x C avec des totaux de lignes répétés, statistiques appliquées, volume 33, numéro 3, 1984, pages 340-352. C'est lié à l'algo de Panefield auquel @Glen_B a fait référence.
Cet algo énumère toutes les tables de présence, c'est à dire passe par toutes les tables possibles où une seule bombe est dans un champ. Il calcule également la multiplicité, c'est-à-dire plusieurs tables qui se ressemblent, et calcule certaines probabilités (pas celles qui vous intéressent). Avec cet algorithme, vous pourrez peut-être exécuter l'énumération complète plus rapidement qu'auparavant.
Présence, non indépendante
L'algorithme AS 205 peut être appliqué à un cas où les lignes et les colonnes ne sont pas indépendantes. Dans ce cas, vous devez appliquer des pondérations différentes à chaque table générée par la logique d'énumération. Le poids dépendra du processus de placement des bombes.
Comtes, indépendance
Pji=Pi×PjPiPjP6=3/15=0.2P3=3/15=0.2P36=0.04
Compte, non indépendant, copules discrètes
Afin de résoudre le problème de comptage lorsque les lignes et les colonnes ne sont pas indépendantes, nous pourrions appliquer des copules discrètes. Ils ont des problèmes: ils ne sont pas uniques. Cela ne les rend cependant pas inutiles. Donc, j'essaierais d'appliquer des copules discrètes. Vous pouvez en trouver un bon aperçu dans Genest, C. et J. Nešlehová (2007). Une introduction aux copules pour les données de comptage. Astin Bull. 37 (2), 475–515.
Les copules peuvent être particulièrement utiles, car elles permettent généralement d'induire explicitement une dépendance ou de l'estimer à partir de données lorsque les données sont disponibles. Je veux dire la dépendance des rangées et des colonnes lors du placement des bombes. Par exemple, cela pourrait être le cas lorsque si la bombe est dans la première rangée, alors il est plus probable qu'elle sera également dans la première colonne.
Exemple
θC(u,v)=(u−θ+u−θ−1)−1/θ
θ
Indépendant
θ=0.000001
Vous pouvez voir comment dans la colonne 5 la probabilité de la deuxième ligne a une probabilité deux fois plus élevée que la première ligne. Ce n'est pas faux contrairement à ce que vous sembliez impliquer dans votre question. Toutes les probabilités s'additionnent à 100%, bien sûr, tout comme les marginaux sur les panneaux correspondent aux fréquences. Par exemple, la colonne 5 dans le panneau inférieur montre 1/3 ce qui correspond aux 5 bombes déclarées sur un total de 15 comme prévu.
Correlation positive
θ=10
Corrélation négative
θ=−0.2
Vous pouvez voir que toutes les probabilités totalisent 100%, bien sûr. En outre, vous pouvez voir comment la dépendance affecte la forme du PMF. Pour la dépendance positive (corrélation), vous obtenez le PMF le plus élevé concentré sur la diagonale, tandis que pour la dépendance négative, il est hors diagonale