J'ai suivi un cours d'apprentissage automatique à mon collège. Dans l'un des questionnaires, cette question a été posée. Modèle 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Modèle 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Lequel des modèles ci-dessus correspondrait mieux aux données? (supposons que les …
Quelqu'un peut-il m'aider à comprendre les modèles à effets fixes / aléatoires? Vous pouvez soit expliquer à votre manière si vous avez digéré ces concepts ou me diriger vers la ressource (livre, notes, site web) avec une adresse spécifique (numéro de page, chapitre etc.) afin que je puisse les apprendre …
Récemment, la consultation aléatoire de questions a déclenché la mémoire d'un commentaire spontané de l'un de mes professeurs, il y a quelques années, mettant en garde contre l'utilisation des ratios dans les modèles de régression. J'ai donc commencé à lire sur ce sujet, menant finalement à Kronmal 1993. Je veux …
Une base de données de (population, superficie, forme) peut être utilisée pour cartographier la densité de population en attribuant une valeur constante de population / superficie à chaque forme (qui est un polygone tel qu'un bloc de recensement, un secteur, un comté, un état, etc.). Cependant, les populations ne sont …
En lisant sur les méthodes et les résultats de l'analyse statistique, notamment en épidémiologie, j'entends très souvent parler d' ajustement ou de contrôle des modèles. Comment expliqueriez-vous, à un non-statisticien, le but de cela? Comment interprétez-vous vos résultats après avoir contrôlé certaines variables? Une petite visite guidée dans Stata ou …
Il s'agit d'une question concernant une pratique ou une méthode suivie par certains de mes collègues. En faisant un modèle de régression logistique, j'ai vu des gens remplacer des variables catégorielles (ou des variables continues qui sont regroupées) par leur poids de preuve respectif (WoE). Ceci est censé être fait …
Je lisais les modèles linéaires de manuels de Faraway avec R (1ère édition) le week-end dernier. Loin avait un chapitre intitulé "Stratégie statistique et incertitude du modèle". Il a décrit (page 158) qu'il avait généré artificiellement des données à l'aide d'un modèle très compliqué, puis il a demandé à ses …
Je suis relativement nouveau dans les statistiques et j'apprécierais de pouvoir mieux comprendre cela. Dans mon domaine, il existe un modèle de formulaire couramment utilisé: Pt= Po( Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Lorsque les gens adaptent le modèle aux données, ils le linéarisent généralement et correspondent aux éléments suivants Journal( Pt) = …
J'ai déjà posé des questions à ce sujet et j'ai vraiment eu du mal à identifier ce qui fait un paramètre de modèle et ce qui en fait une variable latente. Donc, en regardant divers fils sur ce sujet sur ce site, la principale distinction semble être: Les variables latentes …
Disons que j'ai un problème de sélection de modèle et j'essaie d'utiliser AIC ou BIC pour évaluer les modèles. C'est simple pour les modèles qui ont un certain nombre kkk de paramètres à valeur réelle. Cependant, que se passe-t-il si l'un de nos modèles (par exemple, le modèle Mallows ) …
Je recherche des conseils et des commentaires qui traitent de l'analyse des ratios et des taux. Dans le domaine dans lequel je travaille l'analyse des ratios en particulier est très répandue mais j'ai lu quelques articles qui suggèrent que cela peut être problématique, je pense à: Kronmal, Richard A. 1993. …
J'utilise un modèle d'équation structurelle (SEM) à Amos 18. Je cherchais 100 participants pour mon expérience (utilisée de manière lâche), qui a été jugée probablement insuffisante pour mener à bien une SEM. On m'a dit à plusieurs reprises que SEM (avec EFA, CFA) est une procédure statistique "à large échantillon". …
Quels sont les avantages et les inconvénients de l'utilisation de LARS [1] par rapport à l'utilisation de la descente de coordonnées pour ajuster la régression linéaire régularisée L1? Je m'intéresse principalement aux aspects de performance (mes problèmes ont tendance à avoir Ndes centaines de milliers et p<20). Cependant, toute autre …
C'est une question assez générale: J'ai généralement constaté que l'utilisation de plusieurs modèles différents surpasse un modèle lorsque vous essayez de prédire une série temporelle hors échantillon. Existe-t-il de bons documents démontrant que la combinaison de modèles surclassera un seul modèle? Existe-t-il des meilleures pratiques concernant la combinaison de plusieurs …
J'ai ajusté le modèle à l'aide caret, mais j'ai ensuite réexécuté le modèle à l'aide du gbmpackage. Je crois comprendre que le caretpackage utilise gbmet que la sortie doit être la même. Cependant, un simple test rapide utilisant data(iris)montre une différence dans le modèle d'environ 5% en utilisant RMSE et …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.