Je suis en charge de présenter les résultats des tests A / B (exécutés sur les variantes du site) dans mon entreprise. Nous exécutons le test pendant un mois, puis vérifions les valeurs de p à intervalles réguliers jusqu'à ce que nous atteignions la signification (ou abandonnons si la signification …
Des tests comme Z, t et plusieurs autres supposent que les données sont basées sur un échantillonnage aléatoire. Pourquoi? Supposons que je fais de la recherche expérimentale, où je me soucie beaucoup plus de la validité interne que de la validité externe. Donc, si mon échantillon peut être un peu …
J'ai étudié les statistiques il y a des années et j'ai tout oublié, donc cela peut sembler être des questions conceptuelles générales plutôt que spécifiques, mais voici mon problème. Je travaille pour un site e-commerce en tant que UX Designer. Nous avons un cadre de test A / B qui …
Le contexte Un groupe de sociologues et de statisticiens ( Benjamin et al., 2017 ) ont récemment suggéré que le taux de faux positifs typique ( = .05) utilisé comme seuil pour déterminer la «signification statistique» devait être ajusté à un seuil plus conservateur. ( = .005). Un groupe concurrent …
Les compétitions de Kaggle déterminent les classements finaux sur la base d'un ensemble de tests en suspens. Un ensemble de test retenu est un échantillon; il peut ne pas être représentatif de la population modélisée. Étant donné que chaque soumission est comme une hypothèse, l'algorithme qui a remporté le concours …
Supposons que j'ai sont iid et je veux faire un test d'hypothèse que est 0. Supposons que j'ai un grand n et que je puisse utiliser le théorème de limite centrale. Je pourrais également faire un test que est 0, ce qui devrait être équivalent à tester que est 0. …
J'utilise des modèles linéaires pour effectuer des tests de proportion à 2 échantillons depuis un certain temps, mais je me suis rendu compte que cela pourrait ne pas être complètement correct. Il semble que l'utilisation d'un modèle linéaire généralisé avec un lien famille binomiale + identité donne exactement les résultats …
Je fais référence à la question et à ses réponses: comment comparer la capacité prédictive (probabilité) des modèles développés à partir de la régression logistique? par @Clark Chong et réponses / commentaires par @Frank Harrell. et à la question Degrés de liberté de dans le test de Hosmer-Lemeshowχ2χ2\chi^2 et les …
Dans la littérature, les deux termes sont souvent utilisés comme synonymes ou entrelacés. J'essaie maintenant de trouver une distinction claire entre les deux termes. De mon point de vue, une hypothèse est généralement exprimée via un modèle. Donc, même si nous testons une hypothèse nulle ou alternative, de mon point …
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
Nous étudions les tests statistiques bayésiens et rencontrons un phénomène étrange (du moins pour moi). Prenons le cas suivant: nous souhaitons mesurer quelle population, A ou B, a un taux de conversion plus élevé. Pour un contrôle d' , nous définissons , c'est-à-dire que la probabilité de conversion est égale …
J'ai deux échantillons fortement asymétriques et j'essaie d'utiliser le bootstrap pour comparer leurs moyennes en utilisant la statistique t. Quelle est la bonne procédure pour le faire? Le processus que j'utilise Je m'inquiète de l'opportunité d'utiliser l'erreur type des données originales / observées à l'étape finale lorsque je sais que …
La valeur P est définie comme la probabilité d'obtenir une statistique de test au moins aussi extrême que ce qui est observé, en supposant que l'hypothèse nulle est vraie. En d'autres termes, P( X≥ t | H0)P(X≥t|H0)P( X \ge t | H_0 ) Mais que se passe-t-il si la statistique …
Pour un modèle linéaire gaussien où est supposé se trouver dans un espace vectoriel et a la distribution normale standard sur , la statistique du test pour où est un espace vectoriel, est une fonction un à un croissante de la statistique de déviance : Comment savoir que cette statistique …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.