Je lis les diapositives "Faire une analyse des données bayésiennes" de John Kruschke , mais j'ai en fait une question sur son interprétation des tests t et / ou de l'ensemble du cadre de test de signification d'hypothèse nulle. Il soutient que les valeurs de p sont mal définies car elles dépendent des intentions de l'enquêteur.
En particulier, il donne un exemple (pages 3-6) de deux laboratoires qui collectent des ensembles de données identiques comparant deux traitements. Un laboratoire s'engage à collecter des données auprès de 12 sujets (6 par condition), tandis que l'autre collecte des données pour une durée fixe, ce qui donne également 12 sujets. Selon les diapositives, la valeur critique pour p < 0,05 diffère entre ces deux schémas de collecte de données: t crit = 2,33 pour le premier, mais t crit = 2,45 pour le second!
Un article de blog - que je ne trouve pas maintenant - a suggéré que le scénario à durée fixe a plus de degrés de liberté car ils auraient pu collecter des données sur 11, 13 ou tout autre nombre de sujets, tandis que le scénario à N fixe, par définition, a .
Quelqu'un pourrait-il m'expliquer:
Pourquoi la valeur critique différerait-elle entre ces conditions?
(En supposant que c'est un problème) Comment procéder pour corriger / comparer les effets des différents critères d'arrêt?
Je sais que la définition des critères d'arrêt en fonction de la signification (par exemple, un échantillon jusqu'à ) peut augmenter les chances d'une erreur de type I, mais cela ne semble pas se produire ici, car aucune règle d'arrêt ne dépend du résultat de l'analyse.