Le test d'hypothèse s'apparente à un problème de classification. Disons que nous avons 2 étiquettes possibles pour une observation (sujet) - Coupable vs Non coupable. Que l'hypothèse non coupable soit nulle. Si nous considérions le problème du point de vue de la classification, nous formerions un classificateur qui prédirait la probabilité que le sujet appartienne à chacune des 2 classes, compte tenu des données. Nous choisirions alors la classe ayant la probabilité la plus élevée. Dans ce cas, une probabilité de 0,5 serait le seuil naturel. Nous pouvons modifier le seuil au cas où nous affecterions des coûts différents aux erreurs False Positive vs. False Negative. Mais rarement, nous irions aussi loin que de fixer le seuil à 0,05, c'est-à-dire d'affecter le sujet à la classe "coupable" uniquement si la probabilité est de 0,95 ou plus. Mais si je comprends bien, c'est ce que nous faisons en tant que pratique standard lorsque nous considérons le même problème comme un problème de test d'hypothèse. Dans ce dernier cas, nous n'attribuerons pas le label "Non coupable" - équivalent à l'attribution du label "Coupable" - uniquement si la probabilité d'être "Non coupable" est inférieure à 5%. Et peut-être que cela pourrait avoir du sens si nous voulons vraiment éviter de condamner des innocents. Mais pourquoi cette règle devrait-elle prévaloir dans tous les domaines et dans tous les cas?
Décider quelle hypothèse adopter équivaut à définir un estimateur de la vérité compte tenu des données. Dans l'estimation du maximum de vraisemblance, nous acceptons l'hypothèse la plus probable compte tenu des données - pas nécessairement bien que très majoritairement. Voir le graphique ci-dessous:
En utilisant une approche de vraisemblance maximale, nous préférerions l'hypothèse alternative dans cet exemple si la valeur du prédicteur était supérieure à 3, par exemple 4, bien que la probabilité que cette valeur ait été dérivée de l'hypothèse nulle aurait été supérieure à 0,05.
Et tandis que l'exemple avec lequel j'ai commencé le poste est peut-être chargé d'émotion, nous pourrions penser à d'autres cas, par exemple une amélioration technique. Pourquoi devrions-nous donner un tel avantage au statu quo lorsque les données nous indiquent que la probabilité que la nouvelle solution soit une amélioration est supérieure à la probabilité qu'elle ne l'est pas?