Statistiques et Big Data machine-learning

5

Est-ce de la triche de laisser tomber les valeurs aberrantes basées sur la boîte à moustaches de l'erreur absolue moyenne pour améliorer un modèle de régression

J'ai un modèle de prédiction testé avec quatre méthodes, comme vous pouvez le voir dans la figure ci-dessous. L'attribut prédit par le modèle est compris entre 0 et 8. Vous pouvez remarquer qu'il existe une valeur aberrante supérieure et trois valeurs aberrantes inférieures indiquées par toutes les méthodes. Je me …

15 regression machine-learning multiple-regression predictive-models outliers

2

Quelle est la bonne méthode pour le regroupement de texte court?

Je travaille sur un problème de clustering de texte. Les données contiennent plusieurs phrases. Existe-t-il un bon algorithme qui atteint une grande précision sur un texte court? Pouvez-vous fournir de bonnes références? Des algorithmes tels que KMeans, le clustering spectral ne fonctionnent pas bien pour ce problème.

15 machine-learning clustering text-mining

1

Comment la descente de gradient stochastique pourrait-elle gagner du temps par rapport à la descente de gradient standard?

La descente de gradient standard calculerait le gradient pour l'ensemble des données d'apprentissage. for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad Pour un nombre prédéfini d'époques, nous calculons d'abord le vecteur de gradient weights_grad de la fonction de perte pour l'ensemble de …

15 machine-learning optimization gradient-descent computational-statistics sgd

4

La précision de la machine augmentant le gradient diminue à mesure que le nombre d'itérations augmente

J'expérimente l'algorithme de la machine de renforcement de gradient via le caretpackage en R. À l'aide d'un petit ensemble de données d'admission à l'université, j'ai exécuté le code suivant: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

1

Quelles sont les bonnes questions d'entrevue pour les candidats au développement d'algorithmes statistiques?

J'interviewe des personnes pour un poste de développeur / chercheur d'algorithmes dans un contexte de statistiques / d'apprentissage automatique / d'exploration de données. Je recherche des questions à poser pour déterminer, en particulier, la familiarité, la compréhension et la fluidité d'un candidat avec la théorie sous-jacente, par exemple les propriétés …

15 machine-learning probability distributions

2

Que signifie la théorie de l'apprentissage PAC?

Je suis nouveau dans l'apprentissage automatique. J'étudie un cours en machine learning (Stanford University) et je n'ai pas compris ce que l'on entend par cette théorie et quelle est son utilité. Je me demande si quelqu'un pourrait détailler cette théorie pour moi. Cette théorie est basée sur cette équation.

15 machine-learning probability pac-learning

3

Dans le lissage de Kneser-Ney, comment les mots invisibles sont-ils traités?

D'après ce que j'ai vu, la formule de lissage (de second ordre) de Kneser-Ney est d'une manière ou d'une autre donnée comme P2KN(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn)PKN2(wn|wn−1)=max{C(wn−1,wn)−D,0}∑w′C(wn−1,w′)+λ(wn−1)×Pcont(wn) \begin{align} P^2_{KN}(w_n|w_{n-1}) &= \frac{\max \left\{ C\left(w_{n-1}, w_n\right) - D, 0\right\}}{\sum_{w'} C\left(w_{n-1}, w'\right)} + \lambda(w_{n-1}) \times P_{cont}(w_n) \end{align} avec le facteur de normalisation λ(wn−1)λ(wn−1)\lambda(w_{n-1}) donné comme λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙)λ(wn−1)=D∑w′C(wn−1,w′)×N1+(wn−1∙) \begin{align} …

15 machine-learning natural-language naive-bayes smoothing language-models

3

Suggestions pour un apprentissage sensible aux coûts dans un environnement très déséquilibré

J'ai un ensemble de données avec quelques millions de lignes et ~ 100 colonnes. Je voudrais détecter environ 1% des exemples dans l'ensemble de données, qui appartiennent à une classe commune. J'ai une contrainte de précision minimale, mais en raison d'un coût très asymétrique, je ne suis pas trop intéressé …

15 machine-learning classification unbalanced-classes precision-recall

1

Thésaurus des termes statistiques et d'apprentissage automatique

Existe-t-il un thésaurus de référence pour les termes statistiques et d'apprentissage automatique? Je sais que les articles de Wikipédia contiennent souvent des synonymes, mais j'aimerais avoir un simple thésaurus que je pourrais parcourir facilement (par rapport à une encyclopédie complète) pour m'assurer de connaître tout le jargon.

15 machine-learning terminology

1

Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?

Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

1

Signification des termes de sortie dans le package gbm?

J'utilise le paquet gbm pour la classification. Comme prévu, les résultats sont bons. Mais j'essaie de comprendre la sortie du classificateur. Il y a cinq termes en sortie. `Iter TrainDeviance ValidDeviance StepSize Improve` Quelqu'un pourrait-il expliquer la signification de chaque terme, en particulier la signification de Améliorer .

15 r machine-learning

3

Qu'est-ce que le mélange de données?

Ce terme apparaît fréquemment dans les threads liés à la méthode . Le mélange est-il une méthode spécifique dans l'exploration de données et l'apprentissage statistique? Je ne parviens pas à obtenir un résultat pertinent de Google. Il semble que le mélange mélange les résultats de nombreux modèles et donne un …

15 machine-learning data-mining unsupervised-learning statistical-learning

2

Combiner des classificateurs en lançant une pièce

J'étudie un cours d'apprentissage automatique et les diapositives de la conférence contiennent des informations que je trouve en contradiction avec le livre recommandé. Le problème est le suivant: il existe trois classificateurs: classificateur A offrant de meilleures performances dans la plage inférieure des seuils, classificateur B offrant de meilleures performances …

15 machine-learning probability data-visualization classification roc

2

Analyse au moment de l'exécution des algorithmes courants d'apprentissage automatique

Quelqu'un fait-il référence à un résumé des analyses d'exécution pour les algorithmes d'apprentissage automatique courants (différentes versions de NN, SVM, etc.)?

15 machine-learning references algorithms

2

L'augmentation du nombre de fonctionnalités entraîne une baisse de la précision mais une augmentation du préc / rappel

Je suis nouveau dans le Machine Learning. En ce moment, j'utilise un classifieur Naive Bayes (NB) pour classer les petits textes en 3 classes comme positifs, négatifs ou neutres, en utilisant NLTK et python. Après avoir effectué quelques tests, avec un ensemble de données composé de 300 000 instances (16 …

15 machine-learning classification naive-bayes precision-recall

Questions marquées «machine-learning»