Comment reformuler statistiquement cette question

J'analyse un ensemble de données contenant des observations de n nombre de tentatives par des joueurs dans un jeu. Si je construis un modèle de régression pour prédire le résultat de chaque tentative avec un ou plusieurs descripteurs concernant chaque tentative de joueur , comment puis-je mesurer le nombre de tentatives qu'un joueur doit avoir avant qu'un descripteur particulier ne devienne "significatif" ou "significatif" compte tenu de notre ensemble de données ?

Un bon exemple serait un groupe de personnes jouant aux fléchettes. Un novice absolu pourrait fermer les yeux, lancer la fléchette et frapper un oeil de boeuf. Évidemment, nous savons que c'était une pure chance, il n'a jamais joué auparavant, et diable, il pourrait même être intoxiqué. Mais disons qu'il lance 5 fléchettes de plus et frappe un oeil de boeuf 3 fois de plus sur ces 5. Il a maintenant lancé 6 fléchettes et a touché un oeil de boeuf 50% du temps. Maintenant, les choses deviennent suspectes ...

À quel moment ce vrai novice lance-t-il suffisamment de fléchettes, et combien de tentatives a-t-il besoin avant de pouvoir dire qu'il a un talent sérieux au-dessus d'autres joueurs plus expérimentés? Quel est ce terme dans les statistiques et où puis-je en savoir plus?

Avertissement: J'ai essayé d'éviter autant que possible d'utiliser des termes statistiques chargés tels que «signification» et «observations», même si je pensais qu'ils étaient appropriés à certains endroits ici.

Si quelqu'un pouvait m'orienter dans la bonne direction, ce serait fantastique. Merci!!

— KidMcC
source

Vous n'êtes qu'à quelques pas de devenir un Bayésien ...

— Marcelo Ventura

C'est donc une question d'intervalles de confiance alors que davantage de fléchettes sont lancées, dans une certaine mesure?

— KidMcC

Ce que vous regardez peut être un test séquentiel. Ou, vous voudrez peut-être calculer la puissance statistique, c'est-à-dire le nombre d'échantillons que vous devez prélever pour réduire l'erreur bêta; notez que lorsque vous regardez un certain joueur, les échantillons ne sont pas indépendants. Tout cela pourrait aussi naturellement être intégré dans un cadre bayésien, comme l'a dit le premier commentateur.

— Regenschein

Adaptatif et séquentiel sont deux mots clés utiles.

— whuber

Fléchettes est le plus simple des jeux. Chaque joueur commence avec un score de 501 et lance à tour de rôle 3 fléchettes. Le score de chaque tour est calculé et déduit du total des joueurs. Bullseye marque 50, l'anneau extérieur marque 25 et une fléchette dans l'anneau double ou triple compte le double ou triple le score du segment.

Image de

Maintenant, les probabilités ont été examinées ailleurs . Sur ce site, on nous dit "Un joueur de fléchettes moyennement qualifié aura un écart-type plus important; même si les tirs peuvent, en moyenne, être centrés autour de la même cible, ils seront répartis sur une région plus large. Un joueur de fléchettes pauvre sera ont un écart-type élevé et leurs tirs seront, probablement, dispersés sur une région beaucoup plus large. " C'est .

Ainsi, pour répondre à la question, nous faisons ce que nous faisons toujours. Nous construisons un histogramme des scores, et pour le jeu lui-même, nous pourrions utiliser un score de 501, puis nous ajustons une fonction de densité, puis nous testons cette fonction de densité par rapport aux fonctions de densité d'autres joueurs. Nous avons donc besoin de suffisamment de données pour que notre emplacement et sa déviation aient suffisamment de pouvoir prédictif pour discriminer correctement entre les joueurs. Moins il y a de données, plus les réponses sont floues, et il n'y a pas de nombre magique pour cela, plus on est de fous.

— Carl
source