Questions marquées «regression»

Techniques d'analyse de la relation entre une (ou plusieurs) variables "dépendantes" et des variables "indépendantes".

1
Régression: Transformer les variables
Lorsque vous transformez des variables, devez-vous utiliser la même transformation? Par exemple, puis-je choisir et choisir des variables transformées différemment, comme dans: Soit, l'âge, la durée de l'emploi, la durée de résidence et le revenu.X1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Ou devez-vous être cohérent avec vos …

5
Comment dériver la solution de régression de crête?
J'ai des problèmes avec la dérivation de la solution pour la régression de crête. Je connais la solution de régression sans le terme de régularisation: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Mais après avoir ajouté le terme L2 à la fonction de coût, comment se fait-il que la solution devienneλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX …

5
En quoi les scores de propension sont-ils différents de l’addition de covariables dans une régression et quand sont-ils préférés à cette dernière?
J'admets que je suis relativement nouveau dans les scores de propension et l'analyse causale. Une chose qui ne me semble pas évident en tant que nouveau venu est de savoir en quoi l’équilibrage à l’aide des scores de propension est mathématiquement différent de ce qui se produit lorsque nous ajoutons …



4
Les covariables qui ne sont pas statistiquement significatives doivent-elles être «conservées» lors de la création d'un modèle?
Mon calcul comporte plusieurs covariables pour un modèle, et toutes ne sont pas statistiquement significatives. Devrais-je enlever ceux qui ne le sont pas? Cette question traite du phénomène, mais ne répond pas à ma question: comment interpréter l'effet non significatif d'une covariable dans ANCOVA? Rien dans la réponse à cette …

6
Régression par le plus petit angle vs lasso
La régression aux angles moindres et le lasso tendent à produire des chemins de régularisation très similaires (identiques sauf lorsqu'un coefficient passe à zéro). Ils peuvent tous deux être ajustés efficacement par des algorithmes pratiquement identiques. Y a-t-il jamais une raison pratique de préférer une méthode à une autre?
39 regression  lasso 

3
Une standardisation est-elle nécessaire avant d'ajuster la régression logistique?
Ma question est la suivante: devons-nous normaliser l'ensemble de données pour nous assurer que toutes les variables ont la même échelle, entre [0,1], avant d'ajuster la régression logistique. La formule est la suivante: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mon ensemble de données a 2 variables, elles décrivent la même chose pour deux canaux, mais …

3
Pourquoi la régression polynomiale est-elle considérée comme un cas particulier de régression linéaire multiple?
Si la régression polynomiale modélise les relations non linéaires, comment peut-elle être considérée comme un cas particulier de régression linéaire multiple? Wikipedia note que "Bien que la régression polynomiale adapte un modèle non linéaire aux données, elle est linéaire en tant que problème d’estimation statistique, en ce sens que la …

5
Prédiction dans la régression de Cox
Je fais une régression multivariée de Cox, j'ai mes variables indépendantes significatives et mes valeurs bêta. Le modèle correspond très bien à mes données. Maintenant, j'aimerais utiliser mon modèle et prédire la survie d'une nouvelle observation. Je ne sais pas comment faire cela avec un modèle de Cox. Dans une …

2
Quand les régressions de Poisson et binomiales négatives correspondent-elles aux mêmes coefficients?
J'ai remarqué que dans R, les régressions de Poisson et binomiales négatives (NB) semblent toujours correspondre aux mêmes coefficients pour les prédicteurs catégoriels, mais non continus. Par exemple, voici une régression avec un prédicteur catégorique: data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) …

8
Est-il valide d’inclure une mesure de référence en tant que variable de contrôle lors du test de l’effet d’une variable indépendante sur les scores de changement?
J'essaie d'exécuter une régression OLS: DV: Variation du poids sur un an (poids initial - poids final) IV: Que vous exerciez ou non. Cependant, il semble raisonnable que les personnes plus lourdes perdent plus de poids par unité d'exercice que les personnes plus minces. Ainsi, je voulais inclure une variable …


3
Calculer la variance du coefficient de régression dans la régression linéaire simple
Dans la régression linéaire simple, nous avons , où . J'ai dérivé l'estimateur: où et sont les exemples de moyennes de et .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Maintenant, je …

3
Variance des estimations de validation croisée multipliées par sous la forme : quel est le rôle de la «stabilité»?
TL, DR: Il semble que, contrairement aux conseils répétés, la validation croisée "une fois (LOO-CV)" (laissez-passer une fois) - c’est-à-direun CVfois, avec(le nombre de plis) égal à(le d’observations d’entraînement) - fournit des estimations de l’erreur de généralisation qui sont la moindre variable pour tout, et non la plus variable, en …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.