Questions marquées «assumptions»

Désigne les conditions dans lesquelles une procédure statistique produit des estimations et / ou des inférences valides. Par exemple, de nombreuses techniques statistiques nécessitent l'hypothèse que les données sont échantillonnées au hasard d'une manière ou d'une autre. Les résultats théoriques sur les estimateurs nécessitent généralement des hypothèses sur le mécanisme de génération des données.



5
Quelle est la robustesse du test t d'échantillons indépendants lorsque les distributions des échantillons ne sont pas normales?
J'ai lu que le test t est "raisonnablement robuste" lorsque les distributions des échantillons s'écartent de la normalité. Bien sûr, c'est la distribution d'échantillonnage des différences qui est importante. J'ai des données pour deux groupes. L'un des groupes est fortement asymétrique sur la variable dépendante. La taille de l'échantillon est …

5
Hypothèses des modèles linéaires et que faire si les résidus ne sont pas normalement distribués
Je suis un peu confus quant aux hypothèses de régression linéaire. Jusqu'à présent, j'ai vérifié si: toutes les variables explicatives étaient corrélées linéairement avec la variable de réponse. (C'était le cas) il y avait une colinéarité entre les variables explicatives. (il y avait peu de colinéarité). les distances Cook des …


2
Pourquoi la normalité des résidus est-elle «à peine importante du tout» aux fins de l'estimation de la droite de régression?
Gelman et Hill (2006) écrivent à la p46 que: L'hypothèse de régression qui est généralement la moins importante est que les erreurs sont normalement distribuées. En fait, aux fins de l'estimation de la droite de régression (par rapport à la prévision de points de données individuels), l'hypothèse de normalité est …

2
Quelles sont les hypothèses de régression des crêtes et comment les tester?
Considérons le modèle standard de régression multiple où , donc la normalité, l'homoscédasticité et la non corrélation des erreurs sont toutes valables.Y=Xβ+εY=Xβ+εY=X\beta+\varepsilonε∼N(0,σ2In)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Supposons que nous effectuons une régression de crête, en ajoutant la même petite quantité à tous les éléments de la diagonale de :XXX βridge=[X′X+kI]−1X′Yβridge=[X′X+kI]−1X′Y\beta_\mathrm{ridge}=[X'X+kI]^{-1}X'Y …

5
Hypothèses de régression multiple: en quoi l'hypothèse de normalité est-elle différente de l'hypothèse de variance constante?
J'ai lu que ce sont les conditions d'utilisation du modèle de régression multiple: les résidus du modèle sont presque normaux, la variabilité des résidus est presque constante les résidus sont indépendants, et chaque variable est liée linéairement au résultat. En quoi 1 et 2 sont-ils différents? Vous pouvez en voir …




1
Modélisation prédictive - Faut-il se soucier de la modélisation mixte?
Pour la modélisation prédictive, devons-nous nous préoccuper de concepts statistiques tels que les effets aléatoires et la non indépendance des observations (mesures répétées)? Par exemple.... J'ai des données de 5 campagnes de publipostage (survenues au cours d'une année) avec divers attributs et un drapeau à acheter. Idéalement, j'utiliserais toutes ces …

2
Y a-t-il une hypothèse sur la régression logistique?
Existe-t-il une hypothèse sur la variable de réponse de la régression logistique? Par exemple, supposons que nous ayons points de données. Il semble que la réponse provienne d'une distribution de Bernoulli avec . Par conséquent, nous devrions avoir distributions de Bernoulli, avec différents paramètres .Y i p i = logit …

1
Hypothèses LASSO
Dans un scénario de régression LASSO où y=Xβ+ϵy=Xβ+ϵy= X \beta + \epsilon , et les estimations de LASSO sont données par le problème d'optimisation suivant minβ||y−Xβ||+τ||β||1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Existe-t-il des hypothèses de distribution concernant le ?ϵϵ\epsilon Dans un scénario OLS, on peut s'attendre à ce …

4
Hypothèses de l'analyse en grappes
Toutes mes excuses pour la question rudimentaire, je suis nouveau dans cette forme d'analyse et j'ai une compréhension très limitée des principes jusqu'à présent. Je me demandais simplement si bon nombre des hypothèses paramétriques pour les tests multivariés / univariés s'appliquent à l'analyse de cluster? De nombreuses sources d'informations que …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.