Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'utilise actuellement des modèles linéaires à effets mixtes. J'utilise le package "lme4" dans R. Mes modèles prennent la forme: model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) Avant d'exécuter mes modèles, j'ai vérifié la possible multicolinéarité entre les prédicteurs. Je l'ai fait par: Faire une trame …
Pour la régression Lasso supposons que la meilleure solution (erreur de test minimale par exemple) sélectionne k fonctionnalités, de sorte que \ hat {\ beta} ^ {lasso} = \ left (\ hat {\ beta} _1 ^ {lasso}, \ hat {\ beta} _2 ^ {lasso}, ..., \ hat {\ beta} _k …
J'ai parcouru de nombreux sites d'aide et je ne sais toujours pas comment spécifier des termes imbriqués plus compliqués dans un modèle mixte. Je suis également confus en ce qui concerne l'utilisation de :et /et |en spécifiant les interactions et l'imbrication avec des facteurs aléatoires à l'aide lmer()du lme4package dans …
J'ai un modèle logit qui propose un nombre compris entre 0 et 1 pour de nombreux cas, mais comment pouvons-nous interpréter cela? Prenons un cas avec un logit de 0,20 Pouvons-nous affirmer qu'il existe une probabilité de 20% qu'un cas appartient au groupe B par rapport au groupe A? est-ce …
Je crois comprendre qu'avec la validation croisée et la sélection de modèles, nous essayons de résoudre deux choses: P1 . Estimer la perte attendue sur la population lors de la formation avec notre échantillon P2 . Mesurer et rendre compte de notre incertitude sur cette estimation (variance, intervalles de confiance, …
Je suis très confus quant à savoir s'il est légitime d'inclure une variable dépendante retardée dans un modèle de régression. Fondamentalement, je pense que si ce modèle se concentre sur la relation entre le changement de Y et d'autres variables indépendantes, l'ajout d'une variable dépendante décalée dans le côté droit …
Ceci est similaire à la question des méthodes de rééchantillonnage de Caret , bien que cela n'ait jamais vraiment répondu à cette partie de la question d'une manière convenue. la fonction train de caret offre cvet repeatedcv. Quelle est la différence de dire faire: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 …
Quelles sont exactement les conditions préalables qui doivent être remplies pour que la comparaison des modèles AIC fonctionne? Je viens de contourner cette question lorsque j'ai fait une comparaison comme celle-ci: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] …
En programmation informatique, il existe un premier programme classique pour apprendre / enseigner une nouvelle langue ou un nouveau système, appelé "bonjour le monde". http://en.wikipedia.org/wiki/Hello_world_program Existe-t-il une première visualisation de données classique pour utiliser un package graphique? Si oui, c'est quoi? Et sinon, quels seraient les bons candidats?
Certaines techniques de modélisation prédictive sont plus conçues pour gérer des prédicteurs continus, tandis que d'autres sont meilleures pour gérer des variables catégorielles ou discrètes. Il existe bien sûr des techniques pour transformer un type en un autre (discrétisation, variables muettes, etc.). Cependant, existe-t-il des techniques de modélisation prédictive conçues …
Quel est le lien entre PCA, LDA, CCA et PLS? Ils semblent tous "spectraux" et algébriques linéaires et très bien compris (disons plus de 50 ans de théorie construits autour d'eux). Ils sont utilisés pour des choses très différentes (PCA pour la réduction de la dimensionnalité, LDA pour la classification, …
J'ai une formation novice dans les séries chronologiques (certaines estimations / prévisions ARIMA) et je suis confronté à un problème que je ne comprends pas complètement. Toute aide serait grandement appréciée. J'analyse plusieurs séries chronologiques, toutes sur le même intervalle de temps et toutes de la même fréquence, décrivant toutes …
Je suis nouveau dans le Machine Learning et j'essaie de l'apprendre par moi-même. Récemment, je lisais quelques notes de cours et j'avais une question de base. La diapositive 13 indique que "l'estimation du moindre carré est identique à l'estimation du maximum de vraisemblance dans un modèle gaussien". Il semble que …
Je veux dériver les limites de l' intervalle de confiance de pour le rapport de deux moyennes. Supposons que X 1 ∼ N ( θ 1 , σ 2 ) et X 2 ∼ N ( θ 2 , σ 2 ) étant indépendants, le rapport moyen Γ = θ …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.