Questions marquées «r»

Utilisez cette balise pour toute question * sur le sujet * qui (a) implique «R» en tant que partie critique de la question ou réponse attendue, et (b) n'est pas * seulement * sur la façon d'utiliser «R».

2
Test du rapport de vraisemblance dans R
Supposons que je vais faire une régression logistique univariée sur plusieurs variables indépendantes, comme ceci: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) J'ai fait une comparaison de modèle (test de rapport de vraisemblance) pour voir si le modèle est meilleur que le modèle …
25 r  logistic  diagnostic 


2
Sous-ensemble des vecteurs de séries temporelles R
J'ai une série chronologique et je souhaite la sous-définir tout en la conservant sous forme de série chronologique, en préservant le début, la fin et la fréquence. Par exemple, disons que j'ai une série chronologique: > qs <- ts(101:110, start=c(2009, 2), frequency=4) > qs Qtr1 Qtr2 Qtr3 Qtr4 2009 101 …
25 r  time-series 

3
Analyse quotidienne des séries chronologiques
J'essaie de faire une analyse des séries chronologiques et je suis nouveau dans ce domaine. J'ai un décompte quotidien d'un événement de 2006-2009 et je veux y adapter un modèle de série chronologique. Voici les progrès que j'ai réalisés: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) L'intrigue résultante que j'obtiens est: Afin de …


3
Interprétation des termes d'interaction dans la régression logit avec des variables catégorielles
J'ai des données d'une expérience d'enquête dans laquelle les répondants ont été assignés au hasard à l'un des quatre groupes: > summary(df$Group) Control Treatment1 Treatment2 Treatment3 59 63 62 66 Bien que les trois groupes de traitement varient légèrement dans le stimulus appliqué, la principale distinction qui m'importe est entre …

3
Évaluation de la régression logistique et de l'interprétation de la qualité de l'ajustement Hosmer-Lemeshow
Comme nous le savons tous, il existe 2 méthodes pour évaluer le modèle de régression logistique et elles testent des choses très différentes Puissance prédictive: Obtenez une statistique qui mesure dans quelle mesure vous pouvez prédire la variable dépendante en fonction des variables indépendantes. Les Pseudo R ^ 2 bien …

4
Algorithmes pour la détection d'anomalies de séries chronologiques
J'utilise actuellement AnomalyDetection de Twitter dans R: https://github.com/twitter/AnomalyDetection . Cet algorithme fournit une détection d'anomalies de séries chronologiques pour les données avec saisonnalité. Question: existe-t-il d'autres algorithmes similaires à celui-ci (le contrôle de la saisonnalité n'a pas d'importance)? J'essaie de marquer autant d'algorithmes de séries temporelles que possible sur mes …

2
Lasso bayésien vs lasso ordinaire
Différents logiciels d'implémentation sont disponibles pour le lasso . Je sais que beaucoup de choses ont été discutées entre l'approche bayésienne et l'approche fréquentiste dans différents forums. Ma question est très spécifique au lasso - Quelles sont les différences ou les avantages du lasso baysian par rapport au lasso ordinaire …



2
Comment inclure un terme d'interaction dans GAM?
Le code suivant évalue la similitude entre deux séries chronologiques: set.seed(10) RandData <- rnorm(8760*2) America <- rep(c('NewYork','Miami'),each=8760) Date = seq(from=as.POSIXct("1991-01-01 00:00"), to=as.POSIXct("1991-12-31 23:00"), length=8760) DatNew <- data.frame(Loc = America, Doy = as.numeric(format(Date,format = "%j")), Tod = as.numeric(format(Date,format = "%H")), Temp = RandData, DecTime = rep(seq(1, length(RandData)/2) / (length(RandData)/2), 2)) require(mgcv) …

3
Comment faire une régression logistique dans R lorsque le résultat est fractionné (un rapport de deux comptes)?
J'examine un article qui a l'expérience biologique suivante. Un dispositif est utilisé pour exposer les cellules à différentes quantités de contrainte de cisaillement fluide. À mesure qu'une plus grande contrainte de cisaillement est appliquée aux cellules, un plus grand nombre d'entre elles commencent à se détacher du substrat. À chaque …


3
Quel est le modèle approprié pour les données de comptage sous-dispersées?
J'essaie de modéliser les données de comptage dans R qui sont apparemment sous-dispersées (paramètre de dispersion ~ 0,40). C'est probablement pourquoi un modèle binomial ( ) glmavec family = poissonou négatif glm.nbn'est pas significatif. Quand je regarde les descriptions de mes données, je n'ai pas le biais typique des données …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.