Utilisez cette balise pour toute question * sur le sujet * qui (a) implique «R» en tant que partie critique de la question ou réponse attendue, et (b) n'est pas * seulement * sur la façon d'utiliser «R».
Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 5 ans . J'ai une question concernant l'interprétation des paramètres d'un GLM avec une variable dépendante distribuée gamma. Voici ce que R renvoie pour mon GLM …
J'ai une expérience à mesures répétées où la variable dépendante est un pourcentage et j'ai plusieurs facteurs comme variables indépendantes. Je voudrais utiliser à glmerpartir du package R lme4pour le traiter comme un problème de régression logistique (en spécifiant family=binomial) car il semble s'adapter directement à cette configuration. Mes données …
Est-il possible de contrôler le coût des erreurs de classification dans le package R randomForest ? Dans mon propre travail, les faux négatifs (par exemple, le fait de manquer par erreur qu'une personne peut avoir une maladie) sont beaucoup plus coûteux que les faux positifs. Le package rpart permet à …
Je suis intéressé par des exemples de sources (code R, packages R, livres, chapitres de livre, articles, liens, etc.) pour apprendre des concepts statistiques et mathématiques via R (cela pourrait aussi se faire dans d'autres langues, mais R est ma saveur préférée). Le défi est que l'apprentissage du matériel repose …
J'ai exécuté un modèle de régression OLS sur un ensemble de données avec 5 variables indépendantes. Les variables indépendantes et les variables dépendantes sont à la fois continues et liées linéairement. Le carré R est d'environ 99,3%. Mais quand j'exécute la même chose en utilisant une forêt aléatoire dans R, …
Je me suis récemment lancé dans l'ajustement de modèles mixtes de régression dans le cadre bayésien, en utilisant un algorithme MCMC (fonction MCMCglmm dans R en fait). Je crois avoir compris comment diagnostiquer la convergence du processus d'estimation (trace, tracé de geweke, autocorrélation, distribution postérieure ...). L'une des choses qui …
Je fais des recherches mais je suis resté bloqué au stade de l'analyse (j'aurais dû prêter plus d'attention à mes conférences de statistiques). J'ai collecté deux signaux simultanés: débit intégré pour le volume et changement d'expansion thoracique. J'aimerais comparer les signaux et j'espère finalement tirer le volume du signal d'expansion …
Je me retrouve souvent à former plusieurs modèles prédictifs différents en utilisant caretR. Je vais tous les former sur les mêmes plis de validation croisée, en utilisant caret::: createFolds, puis en choisissant le meilleur modèle basé sur une erreur de validation croisée. Cependant, la prédiction médiane de plusieurs modèles surpasse …
Je me demande quelle est la relation exacte entre le partiel et les coefficients dans un modèle linéaire et si je ne devrais utiliser qu'un seul ou les deux pour illustrer l'importance et l'influence des facteurs.R2R2R^2 Pour autant que je sache, avec summaryj'obtiens des estimations des coefficients, et avec anovala …
Supposons que vous analysez un énorme ensemble de données à hauteur de milliards d'observations par jour, où chaque observation comporte quelques milliers de variables numériques et catégorielles éparses et peut-être redondantes. Disons qu'il y a un problème de régression, un problème de classification binaire déséquilibré et une tâche de «découvrir …
J'ai toujours eu l'impression que la régression n'est qu'une forme plus générale d'ANOVA et que les résultats seraient identiques. Récemment, cependant, j'ai effectué une régression et une ANOVA sur les mêmes données et les résultats diffèrent considérablement. Autrement dit, dans le modèle de régression, les effets principaux et l'interaction sont …
J'ai besoin de calculer l'inverse de la matrice et j'ai utilisé la solvefonction. Bien qu'il fonctionne bien sur les petites matrices, il a solvetendance à être très lent sur les grandes matrices. Je me demandais s'il existe une autre fonction ou combinaison de fonctions (via SVD, QR, LU ou d'autres …
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. J'ai créé un modèle linéaire R: mod = lm(train_y ~ train_x). Je veux lui passer une liste de X et obtenir …
Je monte un modèle ARIMA sur une série temporelle quotidienne. Les données sont collectées quotidiennement du 02-01-2010 au 30-07-2011 et concernent les ventes de journaux. Puisqu'une tendance hebdomadaire des ventes peut être trouvée (la quantité moyenne quotidienne d'exemplaires vendus est généralement la même du lundi au vendredi, puis augmente le …
Je voudrais utiliser un modèle de régression logistique binaire dans le contexte des données en streaming (séries temporelles multidimensionnelles) afin de prédire la valeur de la variable dépendante des données (ie ligne) qui vient d'arriver, compte tenu des observations passées. Pour autant que je sache, la régression logistique est traditionnellement …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.