Pourquoi exécuter des tests fractionnés jusqu'à ce que statistiquement significatif soit une «mauvaise chose»? (Ou est-ce?)


9

J'ai lu cet article sur "comment ne pas exécuter un test A / B".

Et je ne comprends toujours pas quel est exactement le raisonnement de l'auteur. Est-ce que quelqu'un peut le faire pour moi?

Je pense que ce que cela pourrait dire, c'est que la lecture des résultats de mes tests fractionnés au fil du temps me trompe. Je veux pouvoir comprendre cela suffisamment bien pour pouvoir l'expliquer aux autres.

De l'aide?

Réponses:


14

C'est le phénomène des «deux meilleurs sur trois». Vous connaissez la blague:

"Allons-y."

"Ok vas-y!"

"Oups, j'ai perdu. Que diriez-vous de retourner deux fois de plus, le gagnant étant le meilleur des trois temps totaux?"

Les tests de signification sont exactement comme le retournement de pièces (mais avec des pièces biaisées, généralement). Si vous exécutez un test court et qu'il n'est pas significatif, vous pouvez peut-être obtenir une signification (en partie grâce à la chance) en prolongeant le test.

L'inverse de cela (je suis tenté de dire le "revers" de ceci :-)) est que si vous prévoyez d'effectuer un certain nombre de tests et de voir un résultat "significatif" au début, ce n'est pas non plus déterminant. C'est analogue à l'inverse de notre premier concours:

"Allons-y. Deux meilleurs sur trois?"

"Ok vas-y!"

"Ha, j'ai gagné le premier flip, donc je gagne!"

Cela dit, notez qu'il existe des versions de tests qui vous permettent de surveiller la signification (nominale) au fur et à mesure. Cela fonctionne comme mettre fin à un concours tôt quand il devient trop unilatéral, ce qu'on appelle des règles de miséricorde . Si, au début, il devient extrêmement évident qu'une différence est réelle, vous pouvez gagner du temps et des efforts en mettant fin au test. Ces procédures sont appelées procédures de test d'hypothèses séquentielles . On pourrait faire valoir que cela devrait être votre méthode standard pour effectuer des tests AB, car à long terme, vous passerez moins de temps et d'efforts dans l'ensemble.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.