Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Quelle est la propriété oracle d'un estimateur? Pour quels objectifs de modélisation la propriété oracle est-elle pertinente (prédictive, explicative, ...)? Des explications théoriquement rigoureuses et (surtout) intuitives sont les bienvenues.
Je fais face à un problème de détection de fraude (de type notation de crédit). En tant que tel, il existe une relation très déséquilibrée entre les observations frauduleuses et non frauduleuses. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html fournit un excellent aperçu des différentes métriques de classification. Precision and Recallou les kappadeux semblent être un …
Quand devrions-nous discrétiser / classer les variables / fonctionnalités indépendantes et quand ne le devrions-nous pas? Mes tentatives pour répondre à la question: En général, nous ne devons pas bin, car le binning perdra des informations. Le binning augmente en fait le degré de liberté du modèle, il est donc …
Eh bien, la question dit tout. Qu'entend-on par «pré-formation d'un réseau neuronal»? Quelqu'un peut-il expliquer en anglais simple et pur? Je n'arrive pas à trouver de ressources liées à cela. Ce serait formidable si quelqu'un pouvait me diriger vers eux.
Je suis un passionné de programmation et d'apprentissage automatique. Il y a seulement quelques mois, j'ai commencé à apprendre la programmation d'apprentissage automatique. Comme beaucoup de ceux qui n'ont pas de formation scientifique quantitative, j'ai également commencé à apprendre le ML en bricolant avec les algorithmes et les jeux de …
J'étudie l'estimation du maximum de vraisemblance et j'ai lu que la fonction de vraisemblance est le produit des probabilités de chaque variable. Pourquoi est-ce le produit? Pourquoi pas la somme? J'ai essayé de rechercher sur Google, mais je ne trouve aucune réponse significative. https://en.wikipedia.org/wiki/Maximum_likelihood
On dit souvent que les tests de permutation n'ont pas d'hypothèses, mais ce n'est certainement pas vrai. Par exemple, si mes échantillons sont en quelque sorte corrélés, je peux imaginer que permuter leurs étiquettes ne serait pas la bonne chose à faire. Je pense seulement que j'ai trouvé ce problème …
La déclaration La distribution d'échantillonnage de la variance de l'échantillon est une distribution khi carré avec un degré de liberté égal à , où est la taille de l'échantillon (étant donné que la variable aléatoire d'intérêt est normalement distribuée).nn - 1n-1n-1nnn La source Mon intuition Cela a un sens intuitif …
L'erreur moyenne à l'échelle absolue (MASE) est une mesure de la précision des prévisions proposée par Koehler et Hyndman (2006) . MA SE= MA EMA Ei n - s a m p l e ,n a i v eMUNESE=MUNEEMUNEEjen-sunemple,nunejeveMASE=\frac{MAE}{MAE_{in-sample, \, naive}} où est l'erreur absolue moyenne produite par la prévision …
Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 5 ans . J'ai lu d'autres sujets sur les diagrammes de dépendance partielle et la plupart d'entre eux concernent la façon dont vous les tracez réellement …
J'ai des données historiques sur les ventes d'une boulangerie (quotidiennement, sur 3 ans). Maintenant, je veux construire un modèle pour prédire les ventes futures (en utilisant des fonctionnalités comme le jour de la semaine, les variables météorologiques, etc.). Comment dois-je diviser l'ensemble de données pour ajuster et évaluer les modèles? …
Nous avons exécuté une régression logistique à effets mixtes en utilisant la syntaxe suivante; # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) Le sujet et l'objet sont les effets aléatoires. Nous obtenons un résultat étrange qui …
Nous savons que dans le cas d'une distribution préalable correcte, P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta) . La justification habituelle de cette étape est que la distribution marginale de , , est constante par rapport à et peut donc être ignorée lors de la …
Lorsque nous effectuons des expériences (sur de petits échantillons (généralement la taille de l'échantillon par groupe de traitement est d'environ 7 à 8)) sur deux groupes, nous utilisons un test t pour tester la différence. Cependant, lorsque nous effectuons une ANOVA (évidemment pour plus de deux groupes), nous utilisons quelque …
Pourquoi est-il si courant d'obtenir des estimations du maximum de vraisemblance des paramètres, mais vous n'entendez pratiquement jamais parler des estimations des paramètres de vraisemblance attendues (c'est-à-dire basées sur la valeur attendue plutôt que sur le mode d'une fonction de vraisemblance)? Est-ce principalement pour des raisons historiques ou pour des …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.