Statistiques et Big Data hypothesis-testing

2

Pourquoi est-il mal d'arrêter un test A / B avant que la taille d'échantillon optimale soit atteinte?

Je suis en charge de présenter les résultats des tests A / B (exécutés sur les variantes du site) dans mon entreprise. Nous exécutons le test pendant un mois, puis vérifions les valeurs de p à intervalles réguliers jusqu'à ce que nous atteignions la signification (ou abandonnons si la signification …

13 hypothesis-testing statistical-significance bias ab-test optimal-stopping

8

Test d'algorithmes de génération de variables aléatoires

Quelles méthodes sont utilisées pour tester les algorithmes de génération de variables aléatoires?

12 algorithms hypothesis-testing random-variable random-generation

3

Pourquoi plusieurs tests d'hypothèses paramétriques (sinon tous) supposent-ils un échantillonnage aléatoire?

Des tests comme Z, t et plusieurs autres supposent que les données sont basées sur un échantillonnage aléatoire. Pourquoi? Supposons que je fais de la recherche expérimentale, où je me soucie beaucoup plus de la validité interne que de la validité externe. Donc, si mon échantillon peut être un peu …

12 hypothesis-testing sampling parametric randomness

5

Déterminer la taille de l'échantillon avant de commencer une expérience ou de l'exécuter indéfiniment?

J'ai étudié les statistiques il y a des années et j'ai tout oublié, donc cela peut sembler être des questions conceptuelles générales plutôt que spécifiques, mais voici mon problème. Je travaille pour un site e-commerce en tant que UX Designer. Nous avons un cadre de test A / B qui …

12 hypothesis-testing sample-size sequential-analysis

2

Comment justifier rigoureusement les taux d'erreur faux positifs / faux négatifs choisis et le ratio de coûts sous-jacent?

Le contexte Un groupe de sociologues et de statisticiens ( Benjamin et al., 2017 ) ont récemment suggéré que le taux de faux positifs typique ( = .05) utilisé comme seuil pour déterminer la «signification statistique» devait être ajusté à un seuil plus conservateur. ( = .005). Un groupe concurrent …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Les compétitions Kaggle sont-elles gagnées par hasard?

Les compétitions de Kaggle déterminent les classements finaux sur la base d'un ensemble de tests en suspens. Un ensemble de test retenu est un échantillon; il peut ne pas être représentatif de la population modélisée. Étant donné que chaque soumission est comme une hypothèse, l'algorithme qui a remporté le concours …

12 machine-learning probability hypothesis-testing sample kaggle

1

Utilisez pour tester l'hypothèse que parce que le taux de convergence est plus rapide?

Supposons que j'ai sont iid et je veux faire un test d'hypothèse que est 0. Supposons que j'ai un grand n et que je puisse utiliser le théorème de limite centrale. Je pourrais également faire un test que est 0, ce qui devrait être équivalent à tester que est 0. …

12 hypothesis-testing convergence delta-method

2

Utilisation de lm pour le test de proportion à 2 échantillons

J'utilise des modèles linéaires pour effectuer des tests de proportion à 2 échantillons depuis un certain temps, mais je me suis rendu compte que cela pourrait ne pas être complètement correct. Il semble que l'utilisation d'un modèle linéaire généralisé avec un lien famille binomiale + identité donne exactement les résultats …

12 r hypothesis-testing generalized-linear-model proportion

1

Test d'adéquation en régression logistique; quel «ajustement» voulons-nous tester?

Je fais référence à la question et à ses réponses: comment comparer la capacité prédictive (probabilité) des modèles développés à partir de la régression logistique? par @Clark Chong et réponses / commentaires par @Frank Harrell. et à la question Degrés de liberté de dans le test de Hosmer-Lemeshowχ2χ2\chi^2 et les …

12 hypothesis-testing logistic predictive-models regression-strategies hosmer-lemeshow-test

1

Quelle est la différence entre «test d'hypothèse» et «sélection de modèle»?

Dans la littérature, les deux termes sont souvent utilisés comme synonymes ou entrelacés. J'essaie maintenant de trouver une distinction claire entre les deux termes. De mon point de vue, une hypothèse est généralement exprimée via un modèle. Donc, même si nous testons une hypothèse nulle ou alternative, de mon point …

12 hypothesis-testing model-selection regression-strategies

5

Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Pourquoi cette distribution est-elle uniforme?

Nous étudions les tests statistiques bayésiens et rencontrons un phénomène étrange (du moins pour moi). Prenons le cas suivant: nous souhaitons mesurer quelle population, A ou B, a un taux de conversion plus élevé. Pour un contrôle d' , nous définissons , c'est-à-dire que la probabilité de conversion est égale …

12 hypothesis-testing bayesian binomial python beta-distribution

1

Comment effectuer un test bootstrap pour comparer les moyennes de deux échantillons?

J'ai deux échantillons fortement asymétriques et j'essaie d'utiliser le bootstrap pour comparer leurs moyennes en utilisant la statistique t. Quelle est la bonne procédure pour le faire? Le processus que j'utilise Je m'inquiète de l'opportunité d'utiliser l'erreur type des données originales / observées à l'étape finale lorsque je sais que …

12 hypothesis-testing t-test bootstrap

1

Si la distribution de la statistique de test est bimodale, la valeur p signifie-t-elle quelque chose?

La valeur P est définie comme la probabilité d'obtenir une statistique de test au moins aussi extrême que ce qui est observé, en supposant que l'hypothèse nulle est vraie. En d'autres termes, P( X≥ t | H0)P(X≥t|H0)P( X \ge t | H_0 ) Mais que se passe-t-il si la statistique …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

1

Pourquoi le test F dans les modèles linéaires gaussiens est le plus puissant?

Pour un modèle linéaire gaussien où est supposé se trouver dans un espace vectoriel et a la distribution normale standard sur , la statistique du test pour où est un espace vectoriel, est une fonction un à un croissante de la statistique de déviance : Comment savoir que cette statistique …

12 hypothesis-testing normal-distribution linear-model power likelihood-ratio

Questions marquées «hypothesis-testing»