Statistiques et Big Data modeling

2

Étant donné deux modèles de régression linéaire, quel modèle fonctionnerait mieux?

J'ai suivi un cours d'apprentissage automatique à mon collège. Dans l'un des questionnaires, cette question a été posée. Modèle 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Modèle 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Lequel des modèles ci-dessus correspondrait mieux aux données? (supposons que les …

14 regression machine-learning self-study modeling model

3

Concepts derrière les modèles à effets fixes / aléatoires

Quelqu'un peut-il m'aider à comprendre les modèles à effets fixes / aléatoires? Vous pouvez soit expliquer à votre manière si vous avez digéré ces concepts ou me diriger vers la ressource (livre, notes, site web) avec une adresse spécifique (numéro de page, chapitre etc.) afin que je puisse les apprendre …

14 mixed-model modeling random-effects-model fixed-effects-model

1

Ratios in Regression, aka Questions on Kronmal

Récemment, la consultation aléatoire de questions a déclenché la mémoire d'un commentaire spontané de l'un de mes professeurs, il y a quelques années, mettant en garde contre l'utilisation des ratios dans les modèles de régression. J'ai donc commencé à lire sur ce sujet, menant finalement à Kronmal 1993. Je veux …

14 regression modeling interaction weighted-regression ratio

2

Modèle d'estimation de la densité de population

Une base de données de (population, superficie, forme) peut être utilisée pour cartographier la densité de population en attribuant une valeur constante de population / superficie à chaque forme (qui est un polygone tel qu'un bloc de recensement, un secteur, un comté, un état, etc.). Cependant, les populations ne sont …

14 modeling unbiased-estimator spatial

2

Expliquer l'ajustement du modèle, en anglais simple

En lisant sur les méthodes et les résultats de l'analyse statistique, notamment en épidémiologie, j'entends très souvent parler d' ajustement ou de contrôle des modèles. Comment expliqueriez-vous, à un non-statisticien, le but de cela? Comment interprétez-vous vos résultats après avoir contrôlé certaines variables? Une petite visite guidée dans Stata ou …

14 regression modeling epidemiology

3

Remplacement des variables par WoE (Weight of Evidence) dans la régression logistique

Il s'agit d'une question concernant une pratique ou une méthode suivie par certains de mes collègues. En faisant un modèle de régression logistique, j'ai vu des gens remplacer des variables catégorielles (ou des variables continues qui sont regroupées) par leur poids de preuve respectif (WoE). Ceci est censé être fait …

14 regression logistic categorical-data modeling

2

La prédiction est-elle le «critère d'or» pour juger de la capacité des statisticiens?

Je lisais les modèles linéaires de manuels de Faraway avec R (1ère édition) le week-end dernier. Loin avait un chapitre intitulé "Stratégie statistique et incertitude du modèle". Il a décrit (page 158) qu'il avait généré artificiellement des données à l'aide d'un modèle très compliqué, puis il a demandé à ses …

13 predictive-models modeling interpretation

1

Erreur additive ou erreur multiplicative?

Je suis relativement nouveau dans les statistiques et j'apprécierais de pouvoir mieux comprendre cela. Dans mon domaine, il existe un modèle de formulaire couramment utilisé: Pt= Po( Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Lorsque les gens adaptent le modèle aux données, ils le linéarisent généralement et correspondent aux éléments suivants Journal( Pt) = …

13 modeling model error curve-fitting measurement-error

1

Paramètres vs variables latentes

J'ai déjà posé des questions à ce sujet et j'ai vraiment eu du mal à identifier ce qui fait un paramètre de modèle et ce qui en fait une variable latente. Donc, en regardant divers fils sur ce sujet sur ce site, la principale distinction semble être: Les variables latentes …

13 bayesian modeling random-variable latent-variable

1

AIC / BIC: combien de paramètres compte une permutation?

Disons que j'ai un problème de sélection de modèle et j'essaie d'utiliser AIC ou BIC pour évaluer les modèles. C'est simple pour les modèles qui ont un certain nombre kkk de paramètres à valeur réelle. Cependant, que se passe-t-il si l'un de nos modèles (par exemple, le modèle Mallows ) …

13 modeling maximum-likelihood aic fitting bic

1

Techniques d'analyse des ratios

Je recherche des conseils et des commentaires qui traitent de l'analyse des ratios et des taux. Dans le domaine dans lequel je travaille l'analyse des ratios en particulier est très répandue mais j'ai lu quelques articles qui suggèrent que cela peut être problématique, je pense à: Kronmal, Richard A. 1993. …

13 modeling multiple-regression generalized-linear-model interaction confounding

2

Complications d'avoir un très petit échantillon dans un modèle d'équation structurelle

J'utilise un modèle d'équation structurelle (SEM) à Amos 18. Je cherchais 100 participants pour mon expérience (utilisée de manière lâche), qui a été jugée probablement insuffisante pour mener à bien une SEM. On m'a dit à plusieurs reprises que SEM (avec EFA, CFA) est une procédure statistique "à large échantillon". …

13 modeling sample-size bootstrap sem

1

LARS vs descente coordonnée pour le lasso

Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de milliers et p<20). Cependant, toute autre …

13 regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

5

Quand utiliser plusieurs modèles pour la prédiction?

C'est une question assez générale: J'ai généralement constaté que l'utilisation de plusieurs modèles différents surpasse un modèle lorsque vous essayez de prédire une série temporelle hors échantillon. Existe-t-il de bons documents démontrant que la combinaison de modèles surclassera un seul modèle? Existe-t-il des meilleures pratiques concernant la combinaison de plusieurs …

13 time-series modeling model-comparison

1

Package GBM vs Caret utilisant GBM

J'ai ajusté le modèle à l'aide caret, mais j'ai ensuite réexécuté le modèle à l'aide du gbmpackage. Je crois comprendre que le caretpackage utilise gbmet que la sortie doit être la même. Cependant, un simple test rapide utilisant data(iris)montre une différence dans le modèle d'environ 5% en utilisant RMSE et …

13 r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

Questions marquées «modeling»