Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
En réponse à cette question, John Christie a suggéré d'évaluer l'adéquation des modèles de régression logistique en évaluant les résidus. Je sais comment interpréter les résidus dans les MCO, ils sont à la même échelle que le DV et très clairement la différence entre y et le y prévue par …
Dans son livre "All of Statistics", le professeur Larry Wasserman présente l'exemple suivant (11.10, page 188). Supposons que nous ayons une densité telle que , où est un connu (non négatif, intégrable) la fonction, et la constante de normalisation est inconnu .ffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c > 0gggc>0c>0c>0 Nous nous intéressons aux cas où …
Est-il possible d'avoir une équation de régression (multiple) avec deux variables dépendantes ou plus? Bien sûr, vous pouvez exécuter deux équations de régression distinctes, une pour chaque DV, mais cela ne semble pas capturer une relation quelconque entre les deux DV?
Je suis sur le point d'introduire la table normale standard dans mon cours d'introduction aux statistiques et je me suis demandé: qui a créé la première table normale standard? Comment l'ont-ils fait avant l'arrivée des ordinateurs? Je frémis en pensant à une calculatrice en force brute que mille sommes Riemann …
Je comprends que le prior de Jeffreys est invariant sous re-paramétrage. Cependant, ce que je ne comprends pas, c'est pourquoi cette propriété est souhaitée. Pourquoi ne voudriez-vous pas que l’avant change avec un changement de variables?
Le titre du commentaire dans Nature Les scientifiques se soulèvent contre la signification statistique commence par: Valentin Amrhein, Sander Greenland, Blake McShane et plus de 800 signataires appellent à la fin des revendications excitées et au rejet d'effets potentiellement cruciaux. et plus tard contient des déclarations comme: Encore une fois, …
Je suis plutôt évangélique quant à l'utilisation des ratios de vraisemblance pour représenter l'évidence objective de / contre un phénomène donné. Cependant, j’ai récemment appris que le facteur Bayes remplissait une fonction similaire dans le contexte des méthodes bayésiennes (c’est-à-dire que le préalable subjectif est combiné au facteur objectif de …
Lorsque vous essayez d'adapter des modèles à un jeu de données volumineux, il est généralement conseillé de partitionner les données en trois parties: le jeu de données d'apprentissage, de validation et de test. En effet, les modèles ont généralement trois "niveaux" de paramètres: le premier "paramètre" est la classe du …
La saison des vacances m'a donné l'occasion de m'installer près du feu avec Les éléments d'apprentissage statistique . Venant d’une perspective économétrique (fréquentiste), j’ai du mal à comprendre les utilisations de méthodes de réduction telles que la régression de crête, le lasso et la régression du moindre angle (LAR). En …
Dans la littérature sur les modèles hiérarchiques / multiniveaux, j'ai souvent lu des articles sur les "modèles imbriqués" et les "modèles non imbriqués", mais qu'est-ce que cela signifie? Est-ce que quelqu'un pourrait peut-être me donner des exemples ou me parler des implications mathématiques de ce libellé?
Je constate que de nombreux algorithmes d’apprentissage automatique fonctionnent mieux avec une annulation moyenne et une égalisation de covariance. Par exemple, les réseaux de neurones ont tendance à converger plus rapidement et K-Means offre généralement un meilleur clustering avec des fonctionnalités pré-traitées. Je ne vois pas l'intuition derrière ces étapes …
La classification hiérarchique peut être représentée par un dendrogramme. Couper un dendrogramme à un certain niveau donne un ensemble de grappes. La coupe à un autre niveau donne un autre ensemble de grappes. Comment choisiriez-vous où couper le dendrogramme? Y at-il quelque chose que nous pourrions considérer comme un point …
Il est courant d'appliquer PCA (analyse en composantes principales) avant un algorithme de classification (tel que k-means). On pense que cela améliore les résultats de regroupement dans la pratique (réduction du bruit). Cependant, je suis intéressé par une étude comparative et approfondie de la relation entre PCA et k-means. Par …
J'essaie d'utiliser un modèle LASSO pour la prévision et je dois estimer les erreurs-types. Sûrement quelqu'un a déjà écrit un paquet pour faire ceci. Mais pour autant que je sache, aucun des paquets sur CRAN qui font des prédictions à l'aide d'un LASSO ne renverra d'erreurs standard pour ces prédictions. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.