Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Voir aussi une question similaire sur stats.SE . En stimulant les algorithmes tels que AdaBoost et LPBoost, il est connu que les apprenants "faibles" à combiner n'ont qu'à mieux performer que la chance d'être utiles, de Wikipedia: Les classificateurs qu'il utilise peuvent être faibles (c'est-à-dire afficher un taux d'erreur substantiel), …
Il y a une question avec une intention similaire sur programmers.SE . Cette question a de très bonnes réponses, mais le thème général semble être que sans auto-étude, vous n'obtenez nulle part. De toute évidence, il existe une différence majeure entre la programmation et les statistiques - avec la programmation, …
L'API Google Prediction est un service cloud où l'utilisateur peut soumettre des données de formation pour former un classificateur mystérieux et lui demander plus tard de classer les données entrantes, par exemple pour mettre en œuvre des filtres anti-spam ou prédire les préférences de l'utilisateur. Mais qu'est-ce qui se cache …
À titre d'exemple, considérons l' ChickWeightensemble de données dans R. La variance augmente évidemment avec le temps, donc si j'utilise une régression linéaire simple comme: m <- lm(weight ~ Time*Diet, data=ChickWeight) Mes questions: Quels aspects du modèle seront discutables? Les problèmes se limitent-ils à extrapoler en dehors de la Timeplage? …
Existe-t-il des mesures de similitude ou de distance entre deux matrices de covariance symétrique (toutes deux ayant les mêmes dimensions)? Je pense ici aux analogues de la divergence KL de deux distributions de probabilités ou de la distance euclidienne entre vecteurs sauf appliquée aux matrices. J'imagine qu'il y aurait pas …
Quels sont les bons articles décrivant les applications des statistiques qui seraient amusantes et instructives à lire? Pour être clair, je ne recherche pas vraiment des articles décrivant de nouvelles méthodes statistiques (par exemple, un article sur la régression des moindres angles), mais plutôt des articles décrivant comment résoudre des …
Il est utile d'étudier le code d'analyse des données des experts. J'ai récemment parcouru github et il y a un certain nombre de personnes qui partagent du code d'analyse de données là-bas. Cela inclut quelques packages R (qui bien sûr sont disponibles directement auprès du CRAN), mais aussi plusieurs exemples …
J'ai trouvé une formule pour le pseudo dans le livre Extending the Linear Model with R, Julian J. Faraway (p. 59).R2R2R^2 1 - ResidualDevianceNullDeviance1-ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . Est-ce une formule courante pour le pseudo pour les GLM?R2R2R^2
Comment générer des nombres basés sur une distribution discrète arbitraire? Par exemple, j'ai un ensemble de nombres que je veux générer. Disons qu'ils sont étiquetés de 1 à 3 comme suit. 1: 4%, 2: 50%, 3: 46% Fondamentalement, les pourcentages sont des probabilités d'apparaître dans la sortie du générateur de …
Il semble y avoir une discussion croissante sur les camemberts. Les principaux arguments contre cela semblent être: La zone est perçue avec moins de puissance que la longueur. Les graphiques circulaires ont un rapport point-à-pixel de données très faible Cependant, je pense qu'ils peuvent être d'une certaine manière utiles lors …
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute …
La plupart des distributions standard dans R ont une famille de commandes - pdf / pmf, cdf / cmf, quantile, écarts aléatoires (par exemple - dnorm, pnorm, qnorm, rnorm). Je sais qu'il est assez facile d'utiliser certaines commandes standard pour reproduire ces fonctions pour les distributions uniformes discrètes, mais existe-t-il …
Si vous pensez en arrière, à quand avez-vous commencé l'analyse des séries chronologiques. Quels outils, packages R et ressources Internet souhaiteriez-vous connaître? Ce que j'essaie de demander, c'est par où commencer? Plus précisément, existe-t-il des ressources pour R qui se résument vraiment à celui qui est "nouveau" à l'analyse de …
Je cherche une bonne terminologie pour décrire ce que j'essaie de faire, pour faciliter la recherche de ressources. Donc, disons que j'ai deux grappes de points A et B, chacune associée à deux valeurs, X et Y, et je veux mesurer la "distance" entre A et B - c'est-à-dire quelle …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.