Statistiques et Big Data machine-learning

4

Coefficient de corrélation de Matthews avec multi-classe

Le coefficient de corrélation de Matthews ( ) est une mesure pour mesurer la qualité d'une classification binaire ([Wikipedia] [1]). formulation est donnée pour la classification binaire utilisant les valeurs de vrais positifs ( ), de faux positifs ( ), de faux négatifs ( ) et de vrais négatifs ( …

9 machine-learning classification multi-class agreement-statistics

2

Formule AIC dans Introduction à l'apprentissage statistique

Je suis un peu perplexe par une formule présentée dans "Introduction à l'apprentissage statistique" de Hastie. Au chapitre 6, page 212 (sixième impression, disponible ici ), il est indiqué que: AIC=RSSnσ^2+2dnAIC=RSSnσ^2+2dnAIC = \frac{RSS}{n\hat\sigma^2} + \frac{2d}{n} Pour les modèles linéaires avec bruit gaussien, étant le nombre de prédicteurs et étant l'estimation …

9 regression machine-learning aic

2

Modélisation du taux de désabonnement des clients - Apprentissage automatique par rapport aux modèles de danger / survie

Est-il rationnel (théorique, substantiel, statistique) d'opter pour l' apprentissage automatique ou les modèles de risque lors de la modélisation du taux de désabonnement des clients (ou plus généralement, des événements)?

9 machine-learning survival hazard churn

5

Pourquoi (et quand) faut-il apprendre la fonction de récompense à partir d'échantillons dans l'apprentissage par renforcement?

Dans l'apprentissage par renforcement, nous avons une fonction de récompense qui informe l'agent de la qualité de ses actions et états actuels. Dans un cadre général, la fonction de récompense est fonction de trois variables: État actuelSSS Action en cours à l'état actuelπ(s)=aπ(s)=a\pi(s) = a Prochain étatS′S′S' Cela ressemble donc …

9 machine-learning reinforcement-learning

2

Vectorisation de la perte d'entropie croisée

Je suis confronté à un problème lié à la recherche du gradient de la fonction de perte d'entropie croisée par rapport au paramètre où:θθ\theta CE(θ)=−∑iyi∗log(y^i)CE(θ)=−∑iyi∗log(y^i)CE(\theta) = -\sum\nolimits_{i}{y_i*log({\hat{y}_{i}})} Où, et est une entrée vectorielle.y^i=softmax(θi)y^i=softmax(θi)\hat{y}_{i} = softmax(\theta_i)θiθi\theta_i De plus, est un vecteur chaud de la classe correcte et est la prédiction pour …

9 machine-learning neural-networks

1

Comment gérer la modification de la longueur du vecteur d'entrée avec les réseaux de neurones

Je veux former un réseau neuronal avec une séquence de caractères comme vecteur d'entrée. Les exemples d'apprentissage ont une longueur différente et pour cette raison, je ne sais pas comment les représenter. Disons que j'ai deux exemples de séquences, voici des noms: john doe maurice delanoe Le premier exemple est …

9 machine-learning neural-networks feature-selection natural-language

2

Reproduire le tracé de projection d'une analyse discriminante linéaire

J'ai du mal avec les points de projection dans l'analyse discriminante linéaire (LDA). De nombreux livres sur les méthodes statistiques multivariées illustrent l'idée de la LDA avec la figure ci-dessous. La description du problème est la suivante. Nous devons d'abord dessiner une frontière de décision, ajouter une ligne perpendiculaire et …

9 r machine-learning classification discriminant-analysis

2

Comment préparer les interactions des variables catégorielles dans scikit-learn?

Quelle est la meilleure façon de préparer les interactions des caractéristiques catégorielles avant de les adapter à scikit-learn? Avec statsmodelsje pourrais facilement dire en style R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(même chose avec Stata avec regress depvar i.var1##i.var2). Peut-on sklearn.preprocessing.PolynomialFeatures(dans la v0.15, actuellement dev) être utilisé avec des variables …

9 machine-learning interaction python scikit-learn

2

Divergence contrastée persistante pour les RBM

Lorsque nous utilisons l'algorithme d'apprentissage de CD persistant pour les machines Bolzmann restreintes, nous commençons notre chaîne d'échantillonnage Gibbs dans la première itération à un point de données, mais contrairement au CD normal, dans les itérations suivantes, nous ne recommençons pas sur notre chaîne. Au lieu de cela, nous commençons …

9 machine-learning neural-networks rbm

4

Évaluation d'un modèle de régression

Pour les problèmes de classification, j'ai utilisé des réseaux de neurones et mesuré les erreurs de type I et II en utilisant la matrice de confusion et ses mesures selon cette ressource ( miroir ), ce qui est assez simple. Face à un problème d'estimation, comment évaluer les performances du …

9 regression machine-learning estimation model-evaluation

1

Essayer de comprendre le processus gaussien

Je lis le livre GPML et au chapitre 2 (page 15) , il explique comment effectuer une régression en utilisant le processus gaussien (GP), mais j'ai du mal à comprendre comment cela fonctionne. Dans l'inférence bayésienne pour les modèles paramétriques, nous choisissons d'abord un a priori sur les paramètres du …

9 machine-learning gaussian-process

3

Pourquoi svm n'est-il pas aussi bon que l'arbre de décision sur les mêmes données?

Je suis nouveau dans l'apprentissage automatique et j'essaie d'utiliser scikit-learn (sklearn) pour résoudre un problème de classification. Les deux DecisionTree et SVM peuvent former un classificateur à ce problème. J'utilise sklearn.ensemble.RandomForestClassifieret sklearn.svm.SVCpour ajuster les mêmes données de formation (environ 500 000 entrées avec 50 fonctionnalités par entrée). Le RandomForestClassifier sort …

9 machine-learning classification svm scikit-learn

2

Ensemble de données de test très déséquilibré et données d'entraînement équilibrées dans la classification

J'ai un ensemble de formation avec environ 3000 instances positives et 3000 instances négatives. Mais mon ensemble de données de test est à peu près déséquilibré. L'ensemble positif n'a que 50 instances et le négatif a 1500 instances, ce qui entraîne une précision très faible. Existe-t-il des approches pour résoudre …

9 machine-learning classification data-mining svm

1

Le rasoir d'Occam obsolète?

J'ai vu les livres de Vapnik sur l'apprentissage statistique ... J'ai lu les premiers chapitres. Quoi qu'il en soit, ce qui m'a le plus surpris, c'est qu'il pensait que le rasoir de l'Occam était obsolète. Je pensais que c'était lié à la situation dans laquelle le fait de supposer une …

9 machine-learning svm

4

Comment gérer les prévisions de séries chronologiques en ligne?

J'ai été confronté au problème suivant. J'ai une sorte de système en temps réel et à chaque période, je lis sa valeur actuelle, créant une série temporelle (comme 1, 12, 2, 3, 5, 9, 1, ...). Je voudrais connaître les méthodes (statistiques et apprentissage automatique) pour prévoir la prochaine valeur …

9 time-series machine-learning online forecasting

Questions marquées «machine-learning»