Statistiques et Big Data assumptions

6

Taille de l'échantillon pour la régression logistique?

Je veux faire un modèle logistique à partir de mes données d'enquête. Il s'agit d'une petite enquête sur quatre colonies résidentielles dans laquelle seulement 154 répondants ont été interrogés. Ma variable dépendante est «transition satisfaisante vers le travail». J'ai constaté que, sur les 154 répondants, 73 ont déclaré avoir effectué …

26 logistic sample-size assumptions power unbalanced-classes

4

Vérification des hypothèses des modèles mixtes lmer / lme dans R

J'ai exécuté une conception répétée selon laquelle j'ai testé 30 hommes et 30 femmes à travers trois tâches différentes. Je veux comprendre en quoi le comportement des hommes et des femmes est différent et comment cela dépend de la tâche. J'ai utilisé à la fois le package lmer et lme4 …

25 r mixed-model assumptions lme4-nlme

5

Quelle est la robustesse du test t d'échantillons indépendants lorsque les distributions des échantillons ne sont pas normales?

J'ai lu que le test t est "raisonnablement robuste" lorsque les distributions des échantillons s'écartent de la normalité. Bien sûr, c'est la distribution d'échantillonnage des différences qui est importante. J'ai des données pour deux groupes. L'un des groupes est fortement asymétrique sur la variable dépendante. La taille de l'échantillon est …

24 t-test assumptions normality-assumption robust

5

Hypothèses des modèles linéaires et que faire si les résidus ne sont pas normalement distribués

Je suis un peu confus quant aux hypothèses de régression linéaire. Jusqu'à présent, j'ai vérifié si: toutes les variables explicatives étaient corrélées linéairement avec la variable de réponse. (C'était le cas) il y avait une colinéarité entre les variables explicatives. (il y avait peu de colinéarité). les distances Cook des …

22 linear-model residuals assumptions normality-assumption

4

Différence entre les hypothèses sous-jacentes à une corrélation et un test de pente de régression significatif

Ma question est née d'une discussion avec @whuber dans les commentaires d'une autre question . Plus précisément, le commentaire de @whuber était le suivant: Une des raisons pour lesquelles cela pourrait vous surprendre est que les hypothèses sous-jacentes à un test de corrélation et à un test de pente de …

21 regression correlation p-value assumptions

2

Pourquoi la normalité des résidus est-elle «à peine importante du tout» aux fins de l'estimation de la droite de régression?

Gelman et Hill (2006) écrivent à la p46 que: L'hypothèse de régression qui est généralement la moins importante est que les erreurs sont normalement distribuées. En fait, aux fins de l'estimation de la droite de régression (par rapport à la prévision de points de données individuels), l'hypothèse de normalité est …

21 regression residuals assumptions

2

Quelles sont les hypothèses de régression des crêtes et comment les tester?

Considérons le modèle standard de régression multiple où , donc la normalité, l'homoscédasticité et la non corrélation des erreurs sont toutes valables.Y=Xβ+εY=Xβ+εY=X\beta+\varepsilonε∼N(0,σ2In)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Supposons que nous effectuons une régression de crête, en ajoutant la même petite quantité à tous les éléments de la diagonale de :XXX βridge=[X′X+kI]−1X′Yβridge=[X′X+kI]−1X′Y\beta_\mathrm{ridge}=[X'X+kI]^{-1}X'Y …

21 regression assumptions ridge-regression

5

Hypothèses de régression multiple: en quoi l'hypothèse de normalité est-elle différente de l'hypothèse de variance constante?

J'ai lu que ce sont les conditions d'utilisation du modèle de régression multiple: les résidus du modèle sont presque normaux, la variabilité des résidus est presque constante les résidus sont indépendants, et chaque variable est liée linéairement au résultat. En quoi 1 et 2 sont-ils différents? Vous pouvez en voir …

20 regression multiple-regression assumptions

3

Quels tests dois-je utiliser pour confirmer que les résidus sont normalement distribués?

J'ai quelques données qui semblent en traçant un graphique des résidus en fonction du temps presque normal mais je veux en être sûr. Comment puis-je tester la normalité des résidus d'erreur?

20 hypothesis-testing normal-distribution assumptions

2

Choisir entre test et test

Contexte: je fais une présentation à des collègues de travail sur le test d'hypothèse, et je comprends la plupart du temps, mais il y a un aspect que je me noue en essayant de comprendre et d'expliquer aux autres. C'est ce que je pense savoir (veuillez corriger en cas d'erreur!) …

20 hypothesis-testing normal-distribution t-test assumptions z-test

4

Concrètement, comment les gens gèrent-ils l'ANOVA lorsque les données ne répondent pas tout à fait aux hypothèses?

Ce n'est pas une question strictement statistique - je peux lire tous les manuels sur les hypothèses ANOVA - j'essaie de comprendre comment les analystes qui travaillent réellement traitent des données qui ne répondent pas tout à fait aux hypothèses. J'ai parcouru beaucoup de questions sur ce site à la …

19 anova heteroscedasticity assumptions

1

Modélisation prédictive - Faut-il se soucier de la modélisation mixte?

Pour la modélisation prédictive, devons-nous nous préoccuper de concepts statistiques tels que les effets aléatoires et la non indépendance des observations (mesures répétées)? Par exemple.... J'ai des données de 5 campagnes de publipostage (survenues au cours d'une année) avec divers attributs et un drapeau à acheter. Idéalement, j'utiliserais toutes ces …

19 machine-learning predictive-models repeated-measures assumptions

2

Y a-t-il une hypothèse sur la régression logistique?

Existe-t-il une hypothèse sur la variable de réponse de la régression logistique? Par exemple, supposons que nous ayons points de données. Il semble que la réponse provienne d'une distribution de Bernoulli avec . Par conséquent, nous devrions avoir distributions de Bernoulli, avec différents paramètres .Y i p i = logit …

18 regression logistic assumptions iid

1

Hypothèses LASSO

Dans un scénario de régression LASSO où y=Xβ+ϵy=Xβ+ϵy= X \beta + \epsilon , et les estimations de LASSO sont données par le problème d'optimisation suivant minβ||y−Xβ||+τ||β||1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Existe-t-il des hypothèses de distribution concernant le ?ϵϵ\epsilon Dans un scénario OLS, on peut s'attendre à ce …

18 regression lasso assumptions residuals

4

Hypothèses de l'analyse en grappes

Toutes mes excuses pour la question rudimentaire, je suis nouveau dans cette forme d'analyse et j'ai une compréhension très limitée des principes jusqu'à présent. Je me demandais simplement si bon nombre des hypothèses paramétriques pour les tests multivariés / univariés s'appliquent à l'analyse de cluster? De nombreuses sources d'informations que …

16 clustering assumptions

Questions marquées «assumptions»