Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Récemment, je suis tombé sur un article qui propose d'utiliser un classificateur k-NN sur un ensemble de données spécifique. Les auteurs ont utilisé tous les échantillons de données disponibles pour effectuer une validation croisée k-fold pour différentes valeurs k et rapporter les résultats de la validation croisée de la meilleure …
J'ai un CNN à quatre couches pour prédire la réponse au cancer à l'aide de données IRM. J'utilise les activations ReLU pour introduire des non-linéarités. La précision et la perte du train augmentent et diminuent de façon monotone respectivement. Mais, ma précision de test commence à fluctuer énormément. J'ai essayé …
Je suis très nouveau dans les statistiques bayésiennes, et cela peut être une question stupide. Cependant: Considérons un intervalle crédible avec un a priori qui spécifie une distribution uniforme. Par exemple, de 0 à 1, où 0 à 1 représente la plage complète des valeurs possibles d'un effet. Dans ce …
J'essayais d'apprendre l'apprentissage automatique en utilisant le matériel Coursera . Dans cette conférence, Andrew Ng utilise un algorithme de descente de gradient pour trouver les coefficients du modèle de régression linéaire qui minimiseront la fonction d'erreur (fonction de coût). Pour la régression linéaire, avons-nous besoin d'une descente de gradient? Il …
Dans les notes du MIT OpenCourseWare pour 18.05 Introduction to Probability and Statistics, Spring 2014 (actuellement disponible ici ), il indique: La méthode du centile de bootstrap est attrayante en raison de sa simplicité. Cependant, cela dépend de la distribution bootstrap de basée sur un échantillon particulier étant une bonne …
J'ai vu l'autre fil ici, mais je ne pense pas que la réponse ait satisfait la question réelle. Ce que j'ai continuellement lu, c'est que Naive Bayes est un classificateur linéaire (ex: ici ) (tel qu'il trace une frontière de décision linéaire) en utilisant la démonstration des cotes logarithmiques. Cependant, …
Sur l'existence d'un terme d'erreur dans la régression logistique (et sa distribution supposée), j'ai lu à divers endroits que: aucun terme d'erreur n'existe le terme d'erreur a une distribution binomiale (conformément à la distribution de la variable de réponse) le terme d'erreur a une distribution logistique Quelqu'un peut-il clarifier?
En regardant les définitions Wikipedia de: Erreur quadratique moyenne (MSE) Somme résiduelle des carrés (RSS) Il me semble que MSE=1NRSS=1N∑(fi−yi)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 où est le nombre d'échantillons et est notre estimation de .NNNfifif_iyiyiy_i Cependant, aucun des articles de Wikipédia ne mentionne cette relation. Pourquoi? …
Je voudrais déterminer l'importance relative des ensembles de variables par rapport à un randomForestmodèle de classification dans R. La importancefonction fournit la MeanDecreaseGinimétrique pour chaque prédicteur individuel - est-ce aussi simple que de les additionner à travers chaque prédicteur d'un ensemble? Par exemple: # Assumes df has variables a1, a2, …
On prétend souvent que le bootstrap peut fournir une estimation du biais dans un estimateur. Si t est l'estimation pour une statistique, et sont les répliques bootstrap (avec ), alors l'estimation bootstrap de biais est qui semble extrêmement simple et puissant, au point d'être troublant.t^t^\hat tt~it~i\tilde t_ii∈{1,⋯,N}i∈{1,⋯,N}i\in\{1,\cdots,N\}biast≈1N∑it~i−t^biast≈1N∑it~i−t^\begin{equation} \mathrm{bias}_t \approx \frac{1}{N}\sum_i …
J'utilise l'outil libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) pour prendre en charge la classification des vecteurs. Cependant, je suis confus quant au format des données d'entrée. Du README: Le format du fichier de données de formation et de test est: <label> <index1>:<value1> <index2>:<value2> ... . . . Chaque ligne contient une instance …
Disons que j'ai 1000 composants et que j'ai collecté des données sur le nombre de fois où ils enregistrent une défaillance et chaque fois qu'ils enregistrent une défaillance, je garde également une trace du temps qu'il a fallu à mon équipe pour résoudre le problème. En bref, j'ai enregistré le …
Est-il possible de calculer les valeurs AIC ou BIC pour les modèles de régression au lasso et d'autres modèles régularisés où les paramètres n'entrent que partiellement dans l'équation. Comment détermine-t-on les degrés de liberté? J'utilise R pour adapter les modèles de régression au lasso avec la glmnet()fonction du glmnetpackage, et …
Les modèles additifs généralisés sont ceux où par exemple. les fonctions sont lisses et à estimer. Habituellement par des cannelures pénalisées. MGCV est un paquetage en R qui le fait, et l'auteur (Simon Wood) écrit un livre sur son paquetage avec des exemples R. Ruppert et coll. (2003) écrivent un …
Cela ressemble à une question similaire et n'a pas reçu beaucoup de réponses. En omettant des tests tels que Cook's D, et en regardant simplement les résidus en tant que groupe, je suis intéressé par la façon dont les autres utilisent les résidus lors de l'évaluation de la qualité de …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.