Statistiques et Big Data regression

9

Pourquoi est-il possible d'obtenir une statistique F significative (p <0,001) mais des tests t régresseurs non significatifs?

Dans une régression linéaire multiple, pourquoi est-il possible d'avoir une statistique F hautement significative (p <0,001) mais d'avoir des valeurs p très élevées sur tous les tests t de la régression? Dans mon modèle, il y a 10 régresseurs. L'un a une valeur p de 0,1 et le reste est …

70 hypothesis-testing regression t-test multicollinearity

4

Comment le coefficient de corrélation diffère-t-il de la pente de régression?

Je me serais attendu à ce que le coefficient de corrélation soit identique à une pente de régression (bêta). Cependant, juste après avoir comparé les deux, ils sont différents. En quoi diffèrent-ils - quelles informations donnent-ils?

69 regression correlation

2

Forme de l'intervalle de confiance pour les valeurs prédites dans la régression linéaire

J'ai remarqué que l'intervalle de confiance pour les valeurs prédites dans une régression linéaire tend à être étroit autour de la moyenne du prédicteur et de la graisse autour des valeurs minimale et maximale du prédicteur. Ceci peut être vu dans les graphiques de ces 4 régressions linéaires: Je pensais …

69 regression confidence-interval linear-model standard-error prediction-interval

7

Tous les termes d'interaction ont-ils besoin de leurs termes individuels dans un modèle de régression?

En fait, je suis en train de passer en revue un manuscrit où les auteurs comparent 5 à 6 modèles de régression logit et AIC. Cependant, certains modèles comportent des termes d'interaction sans inclure les termes de covariable individuels. Cela a-t-il un sens de faire cela? Par exemple (non spécifique …

68 regression modeling interaction aic

10

Quel est le problème avec l'extrapolation?

Je me souviens d'avoir assisté à des cours de statistiques en tant qu'étudiant de premier cycle sur pourquoi l'extrapolation était une mauvaise idée. En outre, de nombreuses sources en ligne commentent ce sujet. Il y a aussi une mention de cela ici . Quelqu'un peut-il m'aider à comprendre pourquoi l'extrapolation …

68 regression time-series forecasting

1

Quelle corrélation rend une matrice singulière et quelles sont les implications de la singularité ou de la quasi-singularité?

Je fais des calculs sur différentes matrices (principalement dans la régression logistique) et je reçois généralement l'erreur "Matrix is singular", où je dois revenir en arrière et supprimer les variables corrélées. Ma question est la suivante: que considéreriez-vous comme une matrice "fortement" corrélée? Existe-t-il une valeur seuil de corrélation pour …

66 regression correlation matrix multicollinearity singular

5

Vue unifiée sur le retrait: quelle est la relation (le cas échéant) entre le paradoxe de Stein, la régression de la crête et les effets aléatoires dans des modèles mixtes?

Considérons les trois phénomènes suivants. Le paradoxe de Stein: étant donné certaines données de la distribution normale multivariée dans , la moyenne de l'échantillon n'est pas un très bon estimateur de la moyenne vraie. On peut obtenir une estimation avec une erreur quadratique moyenne plus faible si on réduit toutes …

65 regression mixed-model ridge-regression shrinkage steins-phenomenon

4

Comment l'ajout d'un 2nd IV peut-il rendre le 1er IV significatif?

J'ai une question qui est probablement simple, mais elle me déconcerte pour le moment, alors j'espère que vous pourrez m'aider. J'ai un modèle de régression des moindres carrés, avec une variable indépendante et une variable dépendante. La relation n'est pas significative. Maintenant, j'ajoute une deuxième variable indépendante. Maintenant, la relation …

64 regression multiple-regression power suppressor

5

Expliquer la différence entre la régression multiple et la régression multivariée, avec une utilisation minimale de symboles / mathématiques

La régression multiple et multivariée est-elle vraiment différente? Qu'est - ce qu'un variate de toute façon?

63 regression multiple-regression terminology multivariate-regression

7

Régression avec plusieurs variables dépendantes?

Est-il possible d'avoir une équation de régression (multiple) avec deux variables dépendantes ou plus? Bien sûr, vous pouvez exécuter deux équations de régression distinctes, une pour chaque DV, mais cela ne semble pas capturer une relation quelconque entre les deux DV?

62 regression

15

Pourquoi les statistiques paramétriques seraient-elles jamais préférées aux données non paramétriques?

Quelqu'un peut-il m'expliquer pourquoi quelqu'un choisirait-il une méthode statistique paramétrique plutôt qu'une méthode statistique non paramétrique pour le test d'hypothèses ou l'analyse de régression? Dans mon esprit, c'est comme opter pour le rafting et choisir une montre qui ne résiste pas à l'eau, car il se peut que vous ne …

60 regression hypothesis-testing mathematical-statistics estimation nonparametric

9

Quels sont les inconvénients de l’utilisation du lasso pour la sélection variable pour la régression?

D'après ce que je sais, utiliser un lasso pour la sélection de variables résout le problème des entrées corrélées. De plus, étant donné qu’elle est équivalente à la régression par le plus petit angle, elle n’est pas lente en calcul. Cependant, beaucoup de personnes (par exemple des personnes que je …

60 regression feature-selection lasso

3

Pourquoi l’estimation de la crête devient-elle meilleure que celle des MCO en ajoutant une constante à la diagonale?

Je comprends que l’estimation de la régression de crête est la qui minimise la somme résiduelle du carré et une pénalité sur la taille deβββ\betaββ\beta βridge=(λID+X′X)−1X′y=argmin[RSS+λ∥β∥22]βridge=(λID+X′X)−1X′y=argmin⁡[RSS+λ‖β‖22]\beta_\mathrm{ridge} = (\lambda I_D + X'X)^{-1}X'y = \operatorname{argmin}\big[ \text{RSS} + \lambda \|\beta\|^2_2\big] Cependant, je ne comprends pas tout à fait la signification du fait que …

59 regression least-squares ridge-regression shrinkage

6

Qu'est-ce qu'un modèle "saturé"?

Que veut-on dire quand on dit qu'on a un modèle saturé?

59 modeling regression

6

Manière raisonnée de regrouper des variables catégoriques à plusieurs niveaux?

Quelles techniques sont disponibles pour regrouper (ou regrouper) plusieurs catégories en un petit nombre, dans le but de les utiliser comme entrée (prédicteur) dans un modèle statistique? Considérons une variable comme étudiant majeur (discipline choisie par un étudiant de premier cycle). Il est non ordonné et catégorique, mais il peut …

58 regression categorical-data dimensionality-reduction feature-construction many-categories

Questions marquées «regression»