Je lis les livres sur la régression linéaire. Il y a quelques phrases sur les normes L1 et L2. Je les connais, mais je ne comprends pas pourquoi la norme L1 pour les modèles clairsemés. Quelqu'un peut utiliser donner une explication simple?
Je comprends qu'une série temporelle stationnaire en est une dont la moyenne et la variance sont constantes dans le temps. Quelqu'un peut-il expliquer s'il vous plaît pourquoi nous devons nous assurer que notre ensemble de données est stationnaire avant de pouvoir exécuter différents modèles ARIMA ou ARM sur celui-ci? Cela …
L’ANOVA équivaut à une régression linéaire avec l’utilisation de variables nominales appropriées. Les conclusions restent les mêmes, que vous utilisiez une ANOVA ou une régression linéaire. Compte tenu de leur équivalence, y a-t-il une raison pour laquelle l'ANOVA est utilisée au lieu de la régression linéaire? Remarque: je suis particulièrement …
En général, que veut dire que la fraction de la variance dans une analyse comme ACP est expliquée par la première composante principale? Est-ce que quelqu'un peut expliquer cela intuitivement, mais aussi donner une définition mathématique précise de ce que "variance expliquée" signifie en termes d'analyse en composantes principales (ACP)?Xxx …
Lors d'un récent colloque, le résumé du locuteur a affirmé qu'ils utilisaient l'apprentissage automatique. Au cours de l'entretien, la seule chose liée à l'apprentissage automatique était qu'ils effectuaient une régression linéaire sur leurs données. Après avoir calculé les coefficients d'ajustement optimal dans l'espace des paramètres 5D, ils ont comparé ces …
J'avais une question sur l'interprétation des graphiques générés par plot (lm) dans R. Je me demandais si vous pouviez me dire comment interpréter les tracés de localisation d'échelle et d'effet résiduel? Tous les commentaires seraient appréciés. Assumer des connaissances de base en statistique, régression et économétrie.
Le wiki aborde les problèmes qui se posent lorsque la multicollinéarité est un problème en régression linéaire. Le problème fondamental est que la multicolinéarité aboutit à des estimations de paramètres instables, ce qui rend très difficile l'évaluation de l'effet des variables indépendantes sur les variables dépendantes. Je comprends les raisons …
Est-il toujours valable d'inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux? Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux effets?
Dans quelles circonstances faut-il envisager d'utiliser des méthodes de régularisation (régression de crête, de lasso ou de moindre angle) au lieu de MCO? Au cas où cela aiderait à orienter la discussion, mon intérêt principal est d'améliorer la précision prédictive.
Regardez ce graphique Excel: La ligne du meilleur ajustement du «bon sens» apparaîtrait comme une ligne presque verticale au centre des points (modifiée à la main en rouge). Cependant, la ligne de tendance linéaire décidée par Excel est la ligne noire diagonale indiquée. Pourquoi Excel a-t-il produit quelque chose qui …
J'ai souvent rencontré le terme "solution de forme fermée". Que signifie une solution sous forme fermée? Comment détermine-t-on si une solution proche existe pour un problème donné? En recherchant en ligne, j'ai trouvé des informations, mais rien dans le cadre de l'élaboration d'un modèle / solution statistique ou probabiliste. Je …
Bon, je pense donc avoir un échantillon assez décent, en tenant compte de la règle empirique de 20: 1: un échantillon assez volumineux (N = 374) pour un total de 7 variables prédictives candidates. Mon problème est le suivant: quel que soit le jeu de variables de prédiction que j'utilise, …
Pour un intervalle de prédiction en régression linéaire vous utilisez encore E [ Y | x ] = ^ ß 0 + β 1 x pour générer l'intervalle. Vous l'utilisez également pour générer un intervalle de confiance de E [ Y | x 0 ] . Quelle est la différence …
Je suis intéressé par le calcul de l'aire sous la courbe (AUC), ou la statistique C, à la main pour un modèle de régression logistique binaire. Par exemple, dans le jeu de données de validation, j'ai la valeur vraie pour la variable dépendante, rétention (1 = retenue; 0 = non …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.