J'ai récemment fini de lire The Lady Tasting Tea , un livre amusant sur l'histoire des statistiques. À la fin du livre, l'auteur, David Salsburg , propose trois problèmes philosophiques ouverts en statistique, dont les solutions selon lui auraient des implications plus importantes pour l'application de la théorie statistique à la science. Je n'avais jamais entendu parler de ces problèmes auparavant, je suis donc intéressé par les réactions des autres. Je m'aventure dans un territoire que je connais peu, alors je vais juste décrire la représentation de ces problèmes par Salsburg et poser deux questions générales sur ces problèmes ci-dessous.
Les problèmes philosophiques de Salsburg sont:
- Peut-on utiliser des modèles statistiques pour prendre des décisions?
- Quelle est la signification de la probabilité lorsqu'elle est appliquée à la vie réelle?
- Les gens comprennent-ils vraiment la probabilité?
Statistiques et prise de décision
Pour illustrer le problème présenté à la question 1, Salsburg présente le paradoxe suivant. Supposons que nous organisions une loterie avec 10000 billets non numérotés. Si nous utilisons la probabilité pour décider si un billet donné gagnera à la loterie en rejetant cette hypothèse pour les billets avec des probabilités inférieures, par exemple, 001, nous rejetterons l'hypothèse d'un billet gagnant pour tous les billets de la loterie!
Salsburg utilise cet exemple pour faire valoir que la logique est incompatible avec la théorie des probabilités telle que la théorie des probabilités est actuellement comprise, et que, par conséquent, nous n'avons actuellement pas de bons moyens d'intégrer les statistiques (qui, dans sa forme moderne, sont basées en grande partie sur théorie des probabilités) avec un moyen logique de prise de décision.
Le sens de la probabilité
En tant qu'abstraction mathématique, Salsburg soutient que la probabilité fonctionne bien, mais lorsque nous essayons d'appliquer les résultats à la vie réelle, nous nous heurtons au problème que la probabilité n'a pas de signification concrète dans la vie réelle. Plus précisément, lorsque nous disons qu'il y a 95% de chances de pluie demain, il n'est pas clair à quelles entités ces 95% s'appliquent. Cela s'applique-t-il à l'ensemble des expériences possibles que nous pourrions mener pour obtenir des connaissances sur la pluie? Cela s'applique-t-il à l'ensemble des personnes qui pourraient sortir et se mouiller? Salsburg soutient que l'absence de moyen d'interpréter les probabilités crée des problèmes pour tout modèle statistique basé sur la probabilité (c'est-à-dire la plupart d'entre eux).
Les gens comprennent-ils la probabilité?
Salsburg soutient qu'une tentative de résoudre les problèmes avec le manque de moyens concrets d'interprétation des probabilités passe par le concept de " probabilité personnelle ", proposé par Jimmie Savage et Bruno de Finetti, qui comprend la probabilité comme une croyance personnelle quant à la probabilité d'événements futurs. Cependant, pour que la probabilité personnelle fournisse une base cohérente pour la probabilité, les gens doivent avoir une compréhension commune de ce qu'est la probabilité et un moyen commun d'utiliser des preuves pour tirer des conclusions sur la probabilité. Malheureusement, des preuves telles que celles produites par Kahneman et Tversky suggèrent que les croyances personnelles pourraient être une base difficile sur laquelle créer une base cohérente de probabilité. Salsburg suggère que les méthodes statistiques qui modélisent les probabilités comme des croyances (peut-être comme les méthodes bayésiennes? J'étends mes connaissances ici) devront traiter ce problème.
Mes questions
- Dans quelle mesure les problèmes de Salsburg sont-ils vraiment des problèmes pour les statistiques modernes?
- Avons-nous progressé dans la recherche de solutions à ces problèmes?