Dans quelles circonstances voudriez-vous ou ne voudriez-vous pas mettre à l'échelle ou normaliser une variable avant l'ajustement du modèle? Et quels sont les avantages / inconvénients de la mise à l'échelle d'une variable?
Al Rahimi a récemment donné un discours très provocateur dans le NIPS 2017 comparant l'actuel apprentissage automatique à l'alchimie. L’une de ses affirmations est qu’il est nécessaire de revenir aux développements théoriques, de disposer de théorèmes simples prouvant des résultats fondamentaux. Quand il a dit cela, j'ai commencé à chercher …
Quelles sont les idées principales, c'est-à-dire les concepts liés au théorème de Bayes ? Je ne demande aucune déduction de la notation mathématique complexe.
Mon père est un passionné de mathématiques mais peu intéressé par les statistiques. Il serait judicieux d' essayer d'illustrer quelques-unes des merveilleuses statistiques, et le CLT est un candidat de choix. Comment pourriez-vous transmettre la beauté mathématique et l'impact du théorème de la limite centrale à un non-statisticien?
J'y pense d'un point de vue des exigences minimales et très basiques. Quelles sont les théories clés qu'un statisticien de l'industrie (et non universitaire) devrait connaître, comprendre et utiliser régulièrement? Un grand qui vient à l'esprit est la loi des grands nombres . Quels sont les plus essentiels pour appliquer …
J'ai fait un concours d'apprentissage automatique où ils utilisent RMSLE (Root Mean Squared Logarithmic Error) pour évaluer les performances prédisant le prix de vente d'une catégorie d'équipement. Le problème est que je ne sais pas comment interpréter le succès de mon résultat final. Par exemple, si j'ai atteint un RMSLE …
Voir aussi une question similaire sur stats.SE . En stimulant les algorithmes tels que AdaBoost et LPBoost, il est connu que les apprenants "faibles" à combiner n'ont qu'à mieux performer que la chance d'être utiles, de Wikipedia: Les classificateurs qu'il utilise peuvent être faibles (c'est-à-dire afficher un taux d'erreur substantiel), …
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute …
L'algorithme de bandit le plus connu est la borne de confiance supérieure (UCB) qui a popularisé cette classe d'algorithmes. Depuis lors, je suppose qu'il existe désormais de meilleurs algorithmes. Quel est le meilleur algorithme actuel (en termes de performances empiriques ou de limites théoriques)? Cet algorithme est-il optimal dans un …
Je me demandais, pourquoi est-il si important d'avoir un apprentissage automatique fondé sur des principes / théorique? D'un point de vue personnel en tant qu'humain, je peux comprendre pourquoi l'apprentissage automatique fondé sur des principes serait important: les humains aiment comprendre ce qu'ils font, nous trouvons la beauté et la …
La plupart des ressources sur les règles de notation appropriées mentionnent un certain nombre de règles de notation différentes comme la perte de journal, le score de Brier ou la notation sphérique. Cependant, ils ne donnent souvent pas beaucoup d'indications sur les différences entre eux. (Pièce A: Wikipedia .) Choisir …
Plus précisément, je recherche des références (articles, livres) qui montreront et expliqueront rigoureusement la malédiction de la dimensionnalité. Cette question s'est posée après que j'ai commencé à lire ce livre blanc de Lafferty et Wasserman. Dans le troisième paragraphe, ils mentionnent une équation "bien connue" qui implique que le meilleur …
Que signifie dire que "la variance est un estimateur biaisé". Que signifie convertir une estimation biaisée en une estimation non biaisée au moyen d'une formule simple. Que fait exactement cette conversion? Aussi, quelle est l'utilité pratique de cette conversion? Convertissez-vous ces scores lorsque vous utilisez certains types de statistiques?
Je souhaite en savoir plus sur les techniques bayésiennes non paramétriques (et connexes). J'ai une formation en informatique et bien que je n'aie jamais suivi de cours sur la théorie des mesures ou la théorie des probabilités, j'ai eu une formation limitée en probabilités et statistiques. Quelqu'un peut-il recommander une …
Je me demandais si quelqu'un sait ou s'il existe une application en statistique dans laquelle une forte cohérence d'un estimateur est requise au lieu d'une faible cohérence. Autrement dit, une cohérence forte est essentielle pour l'application et l'application ne fonctionnerait pas avec une cohérence faible.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.