Donc, cela peut être une question courante, mais je n'ai jamais trouvé de réponse satisfaisante.
Comment déterminez-vous la probabilité que l'hypothèse nulle soit vraie (ou fausse)?
Supposons que vous offriez aux élèves deux versions différentes d'un test et que vous vouliez voir si les versions étaient équivalentes. Vous effectuez un test t et il donne une valeur de p de 0,02. Quelle belle valeur p! Cela doit signifier qu'il est peu probable que les tests soient équivalents, non? Non. Malheureusement, il semble que P (résultats | null) ne vous indique pas P (null | résultats). La chose normale à faire est de rejeter l'hypothèse nulle lorsque nous rencontrons une faible valeur de p, mais comment savons-nous que nous ne rejetons pas une hypothèse nulle qui est très probablement vraie? Pour donner un exemple idiot, je peux concevoir un test pour Ebola avec un taux de faux positifs de 0,02: mettez 50 boules dans un seau et écrivez «Ebola» sur une. Si je teste quelqu'un avec cela et qu'il choisit la balle «ebola», la valeur de p (P (choisir la balle | ils n'ont pas d'ebola)) est 0,02,
Les choses que j'ai considérées jusqu'à présent:
- En supposant que P (null | résultats) ~ = P (résultats | null) - clairement faux pour certaines applications importantes.
- Accepter ou rejeter une hypothèse sans connaître P (null | résultats) - Pourquoi les acceptons-nous ou les rejetons-nous alors? N'est-ce pas tout le point que nous rejetons ce que nous pensons être vraisemblablement faux et acceptons ce qui est vraisemblablement vrai?
- Utilisez le théorème de Bayes - Mais comment obtenez-vous vos prieurs? Ne vous retrouvez-vous pas au même endroit en essayant de les déterminer expérimentalement? Et les choisir a priori semble très arbitraire.
- J'ai trouvé une question très similaire ici: stats.stackexchange.com/questions/231580/. La seule réponse ici semble dire essentiellement que cela n'a pas de sens de poser des questions sur la probabilité qu'une hypothèse nulle soit vraie car c'est une question bayésienne. Je suis peut-être un bayésien dans l'âme, mais je ne peux pas imaginer ne pas poser cette question. En fait, il semble que l'incompréhension la plus courante des valeurs de p soit qu'elles soient la probabilité d'une vraie hypothèse nulle. Si vous ne pouvez vraiment pas poser cette question en tant que fréquentateur, alors ma principale question est # 3: comment obtenez-vous vos priors sans vous coincer dans une boucle?
Edit: Merci pour toutes les réponses réfléchies. Je veux aborder quelques thèmes communs.
- Définition de la probabilité: je suis sûr qu'il y a beaucoup de littérature à ce sujet, mais ma conception naïve est quelque chose comme "la croyance qu'un être parfaitement rationnel aurait donné l'information" ou "les cotes de paris qui maximiseraient le profit si la situation a été répété et les inconnues ont pu varier ".
- Peut-on jamais connaître P (H0 | résultats)? Certes, cela semble être une question difficile. Je crois cependant que chaque probabilité est théoriquement connaissable, car la probabilité est toujours conditionnelle à l'information donnée. Chaque événement se produira ou ne se produira pas, donc la probabilité n'existe pas avec des informations complètes. Elle n'existe que lorsque les informations sont insuffisantes, elle doit donc être connue. Par exemple, si on me dit que quelqu'un a une pièce de monnaie et qu'on me demande la probabilité d'avoir des têtes, je dirais 50%. Il peut arriver que la pièce pèse 70% des têtes, mais je n'ai pas reçu cette information, donc la probabilité était de 50% pour les informations que je possédais, tout comme si elle atterrissait sur la queue, la probabilité était de 70% têtes quand j'ai appris cela. La probabilité étant toujours conditionnée à un ensemble de données (insuffisantes),
Edit: "Always" peut être un peu trop fort. Il peut y avoir des questions philosophiques pour lesquelles nous ne pouvons pas déterminer la probabilité. Pourtant, dans des situations réelles, alors que nous ne pouvons «presque jamais» avoir une certitude absolue, il devrait «presque toujours» y avoir une meilleure estimation.