J'ai du mal à comprendre la dérivation de l'erreur de prédiction attendue ci-dessous (ESL), en particulier sur la dérivation de 2.11 et 2.12 (conditionnement, le pas vers le minimum point par point). Tous les pointeurs ou liens très appréciés. Ci-dessous, je rapporte l'extrait de ESL pg. 18. Les deux premières …
Premièrement, il donne la probabilité des résultats. Ainsi, par exemple, ses prédictions pour les élections américaines sont actuellement de 82% pour Clinton contre 18% pour Trump. Maintenant, même si Trump gagne, comment puis-je savoir que ce n'était pas seulement les 18% du temps qu'il aurait dû gagner? L'autre problème est …
Je suis vraiment intéressé par la procédure du filet élastique pour la rétraction / sélection des prédicteurs. Cela semble très puissant. Mais du point de vue scientifique, je ne sais pas quoi faire une fois que j'ai obtenu les coefficients. À quelle question réponds-je? Ce sont les variables qui influencent …
J'ai une trame de données qui contient deux séries chronologiques: les dates et les numéros de version des versions d'Emacs et de Firefox. En utilisant une commande ggplot2, il est facile de créer un graphique qui utilise le loess (d'une manière qui semble un peu amusante, ce qui ne me …
Comment le randomForestpackage estime-t-il les probabilités de classe lorsque j'utilise predict(model, data, type = "prob")? J'utilisais rangerpour former des forêts aléatoires en utilisant l' probability = Targument pour prédire les probabilités. rangerdit dans la documentation qu'il: Cultivez une forêt probabiliste comme dans Malley et al. (2012). J'ai simulé quelques données …
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
J'essaie d'apprendre à utiliser les réseaux de neurones. Je lisais ce tutoriel . Après avoir ajusté un réseau neuronal sur une série chronologique en utilisant la valeur en pour prédire la valeur en t + 1, l'auteur obtient le graphique suivant, où la ligne bleue est la série chronologique, le …
Une distribution de Tweedie peut modéliser des données asymétriques avec une masse ponctuelle à zéro lorsque le paramètre (exposant dans la relation moyenne-variance) est compris entre 1 et 2.ppp De même, un modèle gonflé à zéro (qu'il soit par ailleurs continu ou discret) peut avoir un grand nombre de zéros. …
Fermé . Cette question doit être plus ciblée . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle se concentre sur un problème uniquement en modifiant ce message . Fermé il y a 2 ans . Je suis actuellement en train de …
J'ai quelques données intéressantes sur les artistes musicaux les plus populaires diffusées divisées par emplacement en environ 200 districts du Congrès. Je veux voir s'il est possible d'interroger une personne sur ses préférences musicales et de déterminer si elle "écoute comme un démocrate" ou "écoute comme un républicain". (Naturellement, c'est …
Je souhaite développer un modèle de prédiction (Cox PH) pour la mortalité toutes causes confondues dans un ensemble de données de participants dont (presque) tous sont décédés à la fin du suivi (par exemple 1 an). Au lieu de prédire le risque absolu de mourir à un certain moment, je …
J'essaie de résoudre ce problème depuis plus d'un an sans grand progrès. Cela fait partie d'un projet de recherche que je fais, mais je vais l'illustrer avec un exemple d'histoire que j'ai inventé, car le domaine réel du problème est un peu déroutant (eye-tracking). Vous êtes un avion qui suit …
Il semble y avoir beaucoup de confusion dans la comparaison de l'utilisation à l' glmnetintérieur caretpour rechercher un lambda optimal et à utiliser cv.glmnetpour faire la même tâche. De nombreuses questions ont été posées, par exemple: Modèle de classification train.glmnet vs cv.glmnet? Quelle est la bonne façon d'utiliser glmnet avec …
J'ai un ensemble de données avec l'hypothèse que les voisins les plus proches sont les meilleurs prédicteurs. Juste un exemple parfait de gradient bidirectionnel visualisé- Supposons que nous ayons un cas où peu de valeurs manquent, nous pouvons facilement prédire en fonction des voisins et de la tendance. Matrice de …
Je comprends le concept de mise à l'échelle de la matrice de données à utiliser dans un modèle de régression linéaire. Par exemple, dans R, vous pouvez utiliser: scaled.data <- scale(data, scale=TRUE) Ma seule question est, pour les nouvelles observations pour lesquelles je veux prédire les valeurs de sortie, comment …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.