L'article The Odds, Continually Updated mentionne l'histoire d'un pêcheur de Long Island qui doit littéralement sa vie à Bayesian Statistics. Voici la version courte:
Il y a deux pêcheurs sur un bateau au milieu de la nuit. Pendant que l'un est endormi, l'autre tombe dans l'océan. Le bateau continue de rouler sur le pilote automatique tout au long de la nuit jusqu'à ce que le premier gars se réveille enfin et informe la Garde côtière. La Garde côtière utilise un logiciel appelé SAROPS (Search and Rescue Optimal Planning System) pour le trouver juste à temps, car il était hypothermique et presque à court d'énergie pour rester à flot.
Voici la version longue: Un point dans la mer
Je voulais en savoir plus sur la façon dont le théorème de Bayes est réellement appliqué ici. J'ai découvert pas mal de choses sur le logiciel SAROPS juste en faisant des recherches sur Google.
Le simulateur SAROPS
Le composant simulateur prend en compte des données opportunes telles que le courant océanique, le vent, etc. et simule des milliers de chemins de dérive possibles. À partir de ces trajectoires de dérive, une carte de distribution de probabilité est créée.
Notez que les graphiques suivants ne se réfèrent pas au cas du pêcheur disparu que j'ai mentionné ci-dessus, mais sont un exemple de jouet tiré de cette présentation
Carte de probabilité 1 (le rouge indique la probabilité la plus élevée, le bleu la plus faible)
Notez le cercle qui est l'emplacement de départ.
Carte de probabilité 2 - Plus de temps s'est écoulé
Notez que la carte de probabilité est devenue multimodale. En effet, dans cet exemple, plusieurs scénarios sont pris en compte:
- La personne flotte dans l'eau - mode moyen supérieur
- La personne est dans un radeau de sauvetage (plus affectée par le vent du Nord) - 2 derniers modes (séparés à cause des "effets de foc")
Carte de probabilité 3 - La recherche a été effectuée le long des chemins rectangulaires en rouge Cette image montre les chemins optimaux produits par le planificateur (un autre composant de SAROPS). Comme vous pouvez le voir, ces chemins ont été recherchés et la carte de probabilité a été mise à jour par le simulateur.
Vous vous demandez peut-être pourquoi les zones qui ont été recherchées n'ont pas été réduites à une probabilité nulle. C'est parce qu'il y a une probabilité d'échec, , pris en compte, c'est-à-dire qu'il y a une chance non négligeable que le chercheur oublie la personne dans l'eau. Naturellement, la probabilité d'échec est beaucoup plus élevée pour une personne seule à flot que pour une personne dans un radeau de sauvetage (plus facile à voir), c'est pourquoi les probabilités dans la zone supérieure n'ont pas beaucoup baissé.
Effets d'une recherche infructueuse
C'est là que le théorème de Bayes entre en jeu. Une fois la recherche effectuée, la carte de probabilité est mise à jour en conséquence, de sorte qu'une autre recherche peut être planifiée de manière optimale.
Après avoir examiné le théorème de Bayes sur wikipedia et dans l'article Une explication intuitive (et courte) du théorème de Bayes sur BetterExplained.com
J'ai pris l'équation de Bayes:
Et défini A et X comme suit ...
Événement A: la personne se trouve dans cette zone (cellule de la grille)
Test X: recherche infructueuse sur cette zone (cellule de la grille), c.-à-d. Recherche dans cette zone et n'a rien vu
Céder,
J'ai trouvé dans Search and Rescue Optimal Planning System que SAROPS calcule la probabilité d'échec de la recherche,
Alors maintenant, nous avons,
L'équation de Bayes est-elle correctement appliquée ici?
Comment le dénominateur, la probabilité d'une recherche infructueuse, serait-il calculé?
Toujours dans Search and Rescue Optimal Planning System , ils disent
Les probabilités a priori sont "normalisées à la manière bayésienne habituelle" pour produire les probabilités postérieures
Que signifie «normalisé à la mode bayésienne normale» ?
Cela signifie-t-il que toutes les probabilités sont divisées par
Enfin, quelle serait la bonne façon de normaliser la carte de probabilité quadrillée après avoir mis à jour pour une recherche infructueuse, étant donné que puisque vous n'avez pas recherché TOUTES les zones (cellules de la grille), vous auriez des cellules égales à et certains égaux à P ( personne là-bas ∣
Encore une autre note de simplification - selon Search and Rescue Optimal Planning System, la distribution postérieure est en fait calculée en mettant à jour les probabilités des trajectoires de dérive simulées, puis EN recréant la carte de probabilité quadrillée. Afin de garder cet exemple assez simple, j'ai choisi d'ignorer les chemins de simulation et de me concentrer sur les cellules de la grille.