Disons que j'ai un ami (appelons-le "George") qui dit qu'il peut contrôler le lancer de dés en utilisant son esprit (c'est-à-dire, rendre les dés plus susceptibles de tomber sur un nombre spécifique auquel il pense).
Comment puis-je concevoir un test scientifiquement rigoureux pour déterminer s'il peut réellement le faire? (Je ne pense pas vraiment qu'il puisse le faire, bien sûr, mais je veux qu'il accepte les détails d'un test, de style Randi incroyable, avant le début du test.) Je veux réduire les excuses (très probablement) post-test qu'il va trouver.
Voici ce que j'ai jusqu'à présent:
Déterminer la technique physique de lancer des dés (quels dés, tasse de shaker, surface d'atterrissage, etc.)
Définissez une "session de test", composée de X lancers de dés. Cela doit être assez petit pour faire en une seule séance, mais assez grand pour déterminer (après analyse) avec une confiance de 95% à 99% si les dés sont tombés correctement ou ont favorisé un côté
Exécutez des sessions Y sur les dés choisis (sans influence de George), en tant que «contrôle» pour vous assurer que les dés affichent d'eux-mêmes des résultats «équitables»
Exécutez des sessions Z avec George. Avant chacun, lancez un dé séparé pour déterminer sur quel nombre George "se concentrera" pendant toute cette session.
Compilez et analysez les résultats.
George invente quelques excuses pour sa triste performance.
Alors mes questions pour vous:
Des défauts ou des problèmes avec ma méthodologie globale? Quelque chose auquel George s'opposerait probablement?
Dois-je utiliser un D6? Ou un D20? Est-ce que ça importe? Un dé avec plus de faces nécessiterait-il plus de rouleaux pour produire des résultats tout aussi confiants? Ou le contraire? Je préfère moins de rouleaux que plus, pour des raisons pratiques :)
Quelles sont les valeurs raisonnables pour X , Y et Z ? Ils ne sont pas entièrement indépendants l'un de l'autre; si ma valeur choisie de X ne permet que 95% de confiance pour une seule session, alors 1 session sur 20 pourrait «échouer», même sans l'influence de George
Comment définir "succès" ou "échec" pour une session individuelle? (J'ai trouvé cette question qui passe par les détails d'un test du chi carré, donc je pense que c'est ma méthodologie d'évaluation, mais quels sont les seuils de confiance raisonnables?)
Comment définir «succès» ou «échec» pour le test global? George pourrait "gagner" une seule session par pur hasard, mais combien de sessions Z devrait-il passer pour réussir le test?
Je vais probablement analyser ces résultats dans une feuille de calcul MS Excel, si cela fait une différence.