Mise en garde: Cette réponse suppose que la question concerne l'interprétation des valeurs de p et des CI amorcés. Une comparaison entre une valeur de p traditionnelle (non amorcée) et un CI amorcé serait un problème différent.
Avec un test t traditionnel (non amorcé), l'IC à 95% et la position de la valeur p par rapport au seuil de 0,05 pour la signification vous diront toujours la même chose. En effet, ils sont tous deux basés sur les mêmes informations: la distribution t de vos degrés de liberté et la moyenne et l'erreur standard observée dans votre échantillon (ou la différence entre les moyennes et l'erreur standard, dans le cas d'un t- à deux échantillons). tester). Si votre CI ne chevauche pas avec 0, alors votre valeur p sera nécessairement <0,05 --- à moins, bien sûr, qu'il y ait un bogue dans le logiciel ou une erreur utilisateur dans la mise en œuvre ou l'interprétation du test.
Avec un test t bootstrapé, les valeurs CI et p sont toutes deux calculées directement à partir de la distribution empirique générée par le bootstrap: la valeur p est simplement le pourcentage des différences de groupe bootstrapées qui sont plus extrêmes que la différence observée d'origine; l'IC à 95% est le milieu à 95% des différences entre les groupes amorcés. Il n'est pas impossible que la valeur de p et l'IC ne soient pas d'accord sur la signification dans un test bootstrap.
Acceptez-vous ou rejetez-vous l'hypothèse nulle?
Dans le contexte d'un test bootstrapé, la valeur de p (par rapport à l'IC) reflète plus directement l'esprit du test d'hypothèse, il est donc plus logique de s'appuyer sur cette valeur pour décider de rejeter ou non la valeur nulle à votre alpha souhaité (généralement 0,05). Donc, dans votre cas, où la valeur p est inférieure à 0,05 mais que l'IC à 95% contient zéro, je recommande de rejeter l'hypothèse nulle .
Tout cela saute les grandes idées sur l'importance réelle de la «signification» et si oui ou non les tests de signification d'hypothèse nulle sont réellement utiles à un outil. En bref, je recommande toujours de compléter toute analyse de test de signification par une estimation de la taille des effets (pour un test t à deux échantillons, la meilleure estimation de la taille de l'effet sera probablement le d de Cohen ), ce qui peut fournir un contexte supplémentaire pour vous aider à comprendre vos résultats.
Article utile connexe: Quelle est la signification d'un intervalle de confiance tiré de rééchantillonnages amorcés?