Comment choisir un niveau de confiance?


12

J'utilise souvent un niveau de confiance de 90%, acceptant que celui-ci présente un degré d'incertitude supérieur à 95% ou 99%.

Mais existe-t-il des directives sur la façon de choisir le bon niveau de confiance? Ou des directives pour les niveaux de confiance utilisés dans différents domaines?

De plus, dans l'interprétation et la présentation des niveaux de confiance, existe-t-il des guides pour transformer le nombre en langage? Par exemple, comme des guides comme celui-ci pour le r de Pearson ( modifier: ces descriptions sont pour les sciences sociales):

http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html

Mise à jour

Merci pour les réponses ci-dessous. Ils étaient tous TRÈS serviables, perspicaces et instructifs.

De plus, voici quelques bons articles sur le choix du niveau de signification (essentiellement la même question) que j'ai rencontrés en examinant cette question. Ils valident ce qui est dit dans les réponses ci-dessous.

"Quelle est la signification d'une signification de 0,05?"

http://www.p-value.info/2013/01/whats-significance-of-005-significance_6.html

"Aux origines du niveau de signification statistique .05"

http://www.radford.edu/~jaspelme/611/Spring-2007/Cowles-n-Davis_Am-Psyc_orignis-of-05-level.pdf

"Méthode scientifique: erreurs statistiques"

http://www.nature.com/news/scientific-method-statistical-errors-1.14700

Réponses:


9

En plus de l'excellente réponse de Tim, il existe même dans un même champ différentes raisons pour des intervalles de confiance particuliers. Dans un essai clinique pour la laque, par exemple, vous voudriez être très confiant que votre traitement n'est pas susceptible de tuer qui que ce soit, par exemple 99,99%, mais vous seriez parfaitement bien avec un intervalle de confiance de 75% que votre laque fait que les cheveux restent tout droit.

En général, les intervalles de confiance doivent être utilisés de manière à ce que vous soyez à l'aise avec l'incertitude, mais aussi pas si strictes qu'ils réduisent la puissance de votre étude à la non-pertinence. Un intervalle de confiance à 90% signifie que lors de la répétition de l'échantillonnage, vous vous attendez à ce qu'une génération sur dix génère n'inclura pas la vraie valeur. D'après ce que vous recherchez, est-ce acceptable? D'un autre côté, si vous préférez un intervalle de confiance à 99%, votre taille d'échantillon est-elle suffisante pour que votre intervalle ne soit pas inutilement grand? (J'espère que vous décidez du niveau CI avant de faire l'étude, non?)

D'après mon expérience (dans les sciences sociales) et d'après ce que j'ai vu de ma femme (dans les sciences biologiques), bien qu'il existe des normes de type CI / signification dans divers domaines et divers cas spécifiques, il n'est pas rare La majorité du débat sur un sujet consiste à déterminer si vous définissez correctement votre intervalle d'IC ​​ou votre niveau de signification. J'ai assisté à des réunions où un statisticien a patiemment expliqué à un client que même s'il aimait un intervalle de confiance bilatéral de 99%, pour que ses données soient significatives, il faudrait décupler son échantillon; et j'ai participé à des réunions où les clients demandent pourquoi aucune de leurs données ne montre une différence significative, où nous leur expliquons patiemment que c'est parce qu'ils ont choisi un intervalle élevé - ou l'inverse, tout est important parce qu'un intervalle inférieur a été demandé.

Ce que je suggère, c'est de lire certains des principaux articles dans votre domaine (aussi près que possible de votre sujet spécifique) et de voir ce qu'ils utilisent; combinez cela avec votre niveau de confort et la taille de l'échantillon; puis préparez-vous à défendre ce que vous choisissez avec ces informations à portée de main. À moins que vous ne soyez dans un domaine où les règles sont très strictes - les essais cliniques, je suppose, sont les seuls qui soient vraiment aussi stricts, du moins d'après ce que j'ai vu - vous n'obtiendrez rien de mieux. (Et s'il y a des règles strictes, je m'attends à ce que les principaux journaux de votre domaine les suivent!)


5
Il existe des milliers de sprays capillaires commercialisés. J'imagine que nous préférerions qu'aucun d'entre eux ne tue de personnes. Ce semble trop indulgent. ;)α
Alexis

2
@Alexis Malheureusement, pour chaque millier d'utilisateurs, l'un d'entre eux est susceptible d'oublier de ne jamais utiliser de briquet en vaporisant ses cheveux ...
Joe

2
"Un intervalle de confiance à 90% signifie qu'une fois sur dix, vous trouverez une valeur aberrante." C'est carrément faux, à moins que je ne vous
interprète

2
Un IC à 90% signifie que dans 90% des cas, la moyenne de la population se situe dans l'intervalle de confiance et 10% à l'extérieur (d'un côté ou de l'autre) de l'intervalle. Ainsi, 1 fois sur 10, votre résultat n'inclut pas la vraie moyenne. Peut-être que «valeur aberrante» est le mauvais mot (bien que les CI soient souvent (mal) utilisés à cette fin.)
Joe

@Joe, je me rends compte que c'est une ancienne section de commentaires, mais c'est faux. Vous pouvez avoir un IC de n'importe quel niveau de «confiance» qui n'inclut jamais la vraie valeur. Voir ici: stats.stackexchange.com/a/26457/176202
Frans Rodenburg

20

Le choix d'une plage d'intervalle de confiance est une décision subjective . Vous pouvez choisir littéralement n'importe quel intervalle de confiance: 50%, 90%, 99 999% ... etc. Il s'agit de la confiance que vous souhaitez avoir. Les IC les plus couramment utilisés sont probablement à 95%.

En ce qui concerne l'interprétation et le lien que vous avez fourni ... Ce type d'interprétation est une simplification excessive . La corrélation est un bon exemple, car dans différents contextes, différentes valeurs peuvent être considérées comme une corrélation "forte" ou "faible", jetez un œil à un exemple aléatoire du Web :

  • J'ai demandé une fois à un chimiste qui étalonnait un instrument de laboratoire à une norme quelle valeur du coefficient de corrélation elle recherchait. «0,9 est trop bas. Vous avez besoin d'au moins 0,98 ou 0,99. " Elle a obtenu le numéro d'un document d'orientation du gouvernement.
  • J'ai demandé une fois à un ingénieur qui effectuait une analyse de régression d'un processus de traitement quelle valeur du coefficient de corrélation il recherchait. "Tout ce qui se situe entre 0,6 et 0,8 est acceptable." Son professeur d'université lui a dit cela.
  • J'ai demandé une fois à un biologiste qui effectuait une ANOVA de la taille de souris de terrain vivant dans des sols contaminés par rapport à des sols vierges quelle valeur du coefficient de corrélation il recherchait. Il ne le savait pas, mais son seuil était de 0,2 en fonction de la plus petite différence de taille que son modèle pouvait détecter avec le nombre d'échantillons qu'il avait.

Désolé, mais il n'y a pas de raccourcis ...

Pour avoir une meilleure idée de ce que sont les intervalles de confiance, vous pouvez en savoir plus à ce sujet, par exemple ici , ici ou ici .


1
Belle citation. +1.
amibe dit Reinstate Monica

Ce que vous dites des descriptions des corrélations est correct. Il est entièrement lié au terrain. Les descriptions dans le lien concernent les sciences sociales. Je suppose qu'une description de l'intervalle de confiance dépendrait également du champ.
Oliver Moran

9

Bien que, généralement, les niveaux de confiance soient laissés à la discrétion de l'analyste, il existe des cas où ils sont fixés par des lois et des règlements. Je vais vous donner deux exemples.

Dans la supervision bancaire, vous devez utiliser un niveau de confiance de 99% lors du calcul de certains risques, voir p.2 de ce règlement de Bâle .

La FDA peut demander d'utiliser certains niveaux de confiance pour les tests de médicaments et d'instruments dans leurs méthodologies statistiques.

Dans l'ensemble, c'est une bonne pratique de consulter l'expert dans votre domaine pour savoir quelles sont les pratiques et réglementations acceptées concernant les niveaux de confiance.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.