Utilisez cette balise pour toute question * sur le sujet * qui (a) implique «R» en tant que partie critique de la question ou réponse attendue, et (b) n'est pas * seulement * sur la façon d'utiliser «R».
Je recherche une alternative aux arbres de classification qui pourrait donner un meilleur pouvoir prédictif. Les données dont je traite ont des facteurs à la fois pour les variables explicatives et expliquées. Je me souviens avoir rencontré des forêts aléatoires et des réseaux de neurones dans ce contexte, bien que …
J'ai récemment commencé à travailler pour une clinique antituberculeuse. Nous nous réunissons périodiquement pour discuter du nombre de cas de tuberculose que nous traitons actuellement, du nombre de tests administrés, etc. J'aimerais commencer à modéliser ces chiffres afin de ne pas simplement deviner si quelque chose est inhabituel ou non. …
J'ai trouvé deux définitions dans la littérature pour le temps d'autocorrélation d'une série chronologique faiblement stationnaire: τa=1+2∑k=1∞ρkversusτb=1+2∑k=1∞|ρk|τa=1+2∑k=1∞ρkversusτb=1+2∑k=1∞|ρk| \tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right| où ρk=Cov[Xt,Xt+h]Var[Xt]ρk=Cov[Xt,Xt+h]Var[Xt]\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]} est l'autocorrélation au décalagekkk. Une application du temps d'autocorrélation est de trouver la "taille effective de l'échantillon": si …
J'ai utilisé la prcomp()fonction pour effectuer une PCA (analyse des composants principaux) dans R. Cependant, il y a un bogue dans cette fonction, de sorte que le na.actionparamètre ne fonctionne pas. J'ai demandé de l'aide sur stackoverflow ; deux utilisateurs y ont proposé deux manières différentes de gérer les NAvaleurs. …
J'ai des données avec de nombreuses fonctionnalités corrélées, et je veux commencer par réduire les fonctionnalités avec une fonction de base fluide, avant d'exécuter un LDA. J'essaie d'utiliser des splines cubiques naturelles dans le splinespackage avec la nsfonction. Comment dois-je procéder pour attribuer les nœuds? Voici le code R de …
Quelles méthodes puis-je utiliser pour déduire une distribution si je ne connais que trois centiles? Par exemple, je sais que dans un certain ensemble de données, le cinquième centile est 8 135, le 50e centile est 11 259 et le 95e centile est 23 611. Je veux pouvoir passer d'un …
En guise de préquelle à une question sur les modèles mixtes linéaires dans R, et à partager comme référence pour les aficionados de statistiques débutants / intermédiaires, j'ai décidé de publier en tant que "style Q&A" indépendant les étapes impliquées dans le calcul "manuel" du coefficients et valeurs prédites d'une …
Je ne suis même pas sûr que la question ait beaucoup de sens, mais je pense avoir vu quelques titres d'articles où ils proposaient une forêt aléatoire avec des effets aléatoires. Est-ce possible dans R?
Comment puis-je vérifier si mes données, par exemple le salaire, proviennent d'une distribution exponentielle continue dans R? Voici l'histogramme de mon échantillon: . Toute aide sera fortement appréciée!
J'ai étudié le package de démarrage dans R et bien que j'aie trouvé un certain nombre de bonnes amorces sur la façon de l'utiliser, je n'ai encore rien trouvé qui décrive exactement ce qui se passe "dans les coulisses". Par exemple, dans cet exemple , le guide montre comment utiliser …
J'ai un ensemble de données qui est des statistiques provenant d'un forum de discussion Web. J'examine la distribution du nombre de réponses qu'un sujet devrait avoir. En particulier, j'ai créé un ensemble de données qui contient une liste de nombres de réponses de sujets, puis le nombre de sujets qui …
Je voulais expérimenter avec un réseau de neurones pour un problème de classification auquel je suis confronté. Je suis tombé sur des articles qui parlent de RBM. Mais d'après ce que je peux comprendre, ils ne sont pas différents d'avoir un réseau neuronal multicouche. Est-ce exact? De plus, je travaille …
Le package randomForest de R ne peut pas gérer le facteur avec plus de 32 niveaux. Lorsqu'il reçoit plus de 32 niveaux, il émet un message d'erreur: Ne peut pas gérer les prédicteurs catégoriels avec plus de 32 catégories. Mais les données dont je dispose ont plusieurs facteurs. Certains d'entre …
Je voudrais adapter un modèle linéaire (lm) où la variance des résidus dépend clairement de la variable explicative. Pour ce faire, je sais utiliser glm avec la famille Gamma pour modéliser la variance, puis mettre son inverse dans les poids de la fonction lm (exemple: http://nitro.biosci.arizona.edu/r/chapter31 .pdf ) Je me …
Étant donné une sortie d'optim avec une matrice de Hesse, comment calculer les intervalles de confiance des paramètres à l'aide de la matrice de Hesse? fit<-optim(..., hessian=T) hessian<-fit$hessian Je m'intéresse principalement au contexte de l'analyse du maximum de vraisemblance, mais je suis curieux de savoir si la méthode peut être …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.