Questions marquées «generalized-linear-model»

Une généralisation de la régression linéaire permettant des relations non linéaires via une "fonction de liaison" et pour que la variance de la réponse dépende de la valeur prédite. (À ne pas confondre avec le «modèle linéaire général» qui étend le modèle linéaire ordinaire à la structure de covariance générale et à la réponse multivariée.)



1
Pouvez-vous donner une explication simple et intuitive de la méthode IRLS pour trouver le MLE d'un GLM?
Contexte: J'essaie de suivre l'examen de Princeton de l'estimation MLE pour GLM . Je comprends les bases de l' estimation MLE: likelihood, score, observée et attendue Fisher informationet la Fisher scoringtechnique. Et je sais comment justifier une régression linéaire simple avec une estimation MLE . La question: Je ne comprends …




1
Pour la moyenne du modèle d'un GLM, faisons-nous la moyenne des prédictions sur le lien ou l'échelle de réponse?
Pour calculer les prévisions moyennes du modèle sur l'échelle de réponse d'un GLM, qui est "correct" et pourquoi? Calculez la prédiction moyenne du modèle sur l'échelle de liaison, puis retransformez-la en échelle de réponse, ou Transformez les prédictions à l'échelle de réponse, puis calculez la moyenne du modèle Les prédictions …

2
Splines en GLM et GAM
Est-il faux que les splines ne soient disponibles que dans les modèles GAM et non dans les modèles GLM? J'ai entendu cela il y a un certain temps, et je me demande si ce n'est qu'une idée fausse ou s'il y a du vrai. En voici une illustration:



1
Surdispersion et alternatives de modélisation dans les modèles à effet aléatoire de Poisson avec décalages
J'ai rencontré un certain nombre de questions pratiques lors de la modélisation des données de comptage issues de la recherche expérimentale à l'aide d'une expérience intra-sujet. Je décris brièvement l'expérience, les données et ce que j'ai fait jusqu'à présent, suivi de mes questions. Quatre films différents ont été montrés en …

1
Régression logistique avec splines de régression dans R
J'ai développé un modèle de régression logistique basé sur des données rétrospectives d'une base de données nationale sur les traumatismes des traumatismes crâniens au Royaume-Uni. Le résultat clé est la mortalité à 30 jours (dénommée mesure de «survie»). D'autres mesures avec des preuves publiées d'effet significatif sur les résultats dans …

5
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Vérification de la normalité des résidus dans les modèles linéaires généralisés
Cet article utilise des modèles linéaires généralisés (distributions d'erreur binomiale et binomiale négative) pour analyser les données. Mais ensuite, dans la section analyse statistique des méthodes, il y a cette déclaration: ... et deuxièmement en modélisant les données de présence à l'aide de modèles de régression logistique et les données …

1
Existe-t-il un problème avec la multicolinéarité et la régression des splines?
Lors de l'utilisation de splines cubiques naturelles (c'est-à-dire restreintes), les fonctions de base créées sont hautement colinéaires et, lorsqu'elles sont utilisées dans une régression, semblent produire des statistiques VIF (facteur d'inflation de variance) très élevées, signalant la multicolinéarité. Lorsque l'on considère le cas d'un modèle à des fins de prédiction, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.