Statistiques et Big Data machine-learning

3

Quel algorithme puis-je utiliser pour trouver des corrélations entre les événements?

Je suis nouveau dans l'apprentissage automatique, j'essaie donc de trouver de la littérature, mais je ne sais même pas pourquoi Google. Mes données sont de la forme suivante: User A performs Action P User B performs Action Q User C performs Action R ... User C performs Action X User …

12 machine-learning cross-correlation

5

L'apprentissage automatique est-il un rêve?

En découvrant l'apprentissage automatique, je vois différentes techniques intéressantes telles que: régler automatiquement les algorithmes avec des techniques telles que grid search, obtenir des résultats plus précis grâce à la combinaison de différents algorithmes du même "type", c'est-à-dire boosting, obtenir des résultats plus précis grâce à la combinaison de différents …

12 machine-learning algorithms boosting stacking automatic-algorithms

1

Pourquoi les gens n'utilisent-ils pas des RBF plus profonds ou des RBF en combinaison avec MLP?

Donc, en regardant les réseaux de neurones à fonction de base radiale, j'ai remarqué que les gens ne recommandent que l'utilisation d'une seule couche cachée, alors qu'avec les réseaux de neurones perceptron multicouches, plus de couches sont considérées comme meilleures. Étant donné que les réseaux RBF peuvent être entraînés avec …

12 machine-learning neural-networks rbf-network

2

Pourquoi le n-gramme est-il utilisé dans l'identification de la langue du texte au lieu des mots?

Dans deux bibliothèques d'identification de langue populaires, Compact Language Detector 2 pour C ++ et détecteur de langue pour java, les deux utilisaient des n-grammes (basés sur des caractères) pour extraire des fonctionnalités de texte. Pourquoi un sac de mots (un seul mot / dictionnaire) n'est-il pas utilisé, et quels …

12 machine-learning classification text-mining natural-language

2

Comment calculer les poids des critères Fisher?

J'étudie la reconnaissance des formes et l'apprentissage automatique, et je suis tombé sur la question suivante. Considérons un problème de classification à deux classes avec une probabilité de classe antérieure égaleP(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} et la distribution des instances dans chaque classe donnée par p(x|D1)=N([00],[2001]),p(x|D1)=N([00],[2001]), p(x|D_1)= {\cal N} \left( \begin{bmatrix} 0 \\0 …

12 machine-learning self-study classification discriminant-analysis

3

pourquoi la méthode de boosting est sensible aux valeurs aberrantes

J'ai trouvé de nombreux articles qui indiquent que les méthodes de boosting sont sensibles aux valeurs aberrantes, mais aucun article expliquant pourquoi. D'après mon expérience, les valeurs aberrantes sont mauvaises pour tout algorithme d'apprentissage automatique, mais pourquoi les méthodes de renforcement sont-elles particulièrement sensibles? Comment les algorithmes suivants se classeraient-ils …

12 machine-learning svm outliers cart boosting

2

Quand utiliser les réseaux bayésiens par rapport à d'autres approches d'apprentissage automatique?

J'espère qu'il n'y aura peut-être pas de réponse définitive à cette question. Mais j'ai utilisé un certain nombre d'algorithmes d'apprentissage automatique dans le passé et j'essaie d'en apprendre davantage sur les réseaux bayésiens. Je voudrais comprendre dans quelles circonstances ou pour quels types de problèmes choisiriez-vous d'utiliser le réseau bayésien …

12 machine-learning bayesian-network

4

Quelle est la différence entre un réseau neuronal et un perceptron?

Y a-t-il une différence entre les termes "réseau neuronal" et "perceptron"?

12 machine-learning neural-networks terminology perceptron

1

Y a-t-il des utilisations contemporaines du jackknifing?

La question: Bootstrapping est supérieur au jackknifing; cependant, je me demande s'il existe des cas où le jackknifing est la seule ou au moins une option viable pour caractériser l'incertitude à partir des estimations des paramètres. De plus, dans des situations pratiques, dans quelle mesure le jackknifing est-il biaisé / …

12 machine-learning cross-validation bootstrap maximum-entropy jackknife

1

Les différences entre la régression logistique aléatoire et la régression logistique Plaine-Vanille

Je voudrais connaître les différences entre la régression logistique randomisée (RLR) et la régression logistique simple (LR), par conséquent, je lis un article "Sélection de la stabilité" de Meinshausen, et al. ; cependant je ne comprends pas ce qu'est RLR et quelles sont les différences entre RLR et LR. Quelqu'un …

12 machine-learning logistic

1

Y a-t-il une différence entre une supervision à distance, une auto-formation, un apprentissage auto-supervisé et une supervision faible?

D'après ce que j'ai lu: Supervision à distance : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data …

12 machine-learning terminology unsupervised-learning semi-supervised

3

Comprendre les paramètres de la fonction de la base gaussienne à utiliser dans la régression linéaire

Je voudrais appliquer la fonction de base gaussienne dans une implémentation de régression linéaire. Malheureusement, j'ai du mal à comprendre quelques paramètres dans la fonction de base. Plus précisément et .σμμ\muσσ\sigma Mon ensemble de données est une matrice de 10 000 x 31. 10 000 échantillons et 31 fonctionnalités. J'ai …

12 regression machine-learning basis-function

4

Pouvez-vous comparer différentes méthodes de clustering sur un ensemble de données sans vérité de fond par validation croisée?

Actuellement, j'essaie d'analyser un ensemble de données de document texte qui n'a aucune vérité fondamentale. On m'a dit que vous pouvez utiliser la validation croisée k-fold pour comparer différentes méthodes de clustering. Cependant, les exemples que j'ai vus dans le passé utilisent une vérité fondamentale. Existe-t-il un moyen d'utiliser les …

12 machine-learning clustering cross-validation unsupervised-learning

5

Algorithme récursif (en ligne) des moindres carrés régularisés

Quelqu'un peut-il m'orienter vers un algorithme en ligne (récursif) pour la régularisation de Tikhonov (moindres carrés régularisés)? Dans un cadre hors ligne, je calculerais β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY utilisant mon ensemble de données d'origine où λλλ est trouvé en utilisant la validation croisée n fois. Une nouvelle valeur yyy peut être prédite pour …

12 regression machine-learning least-squares regularization online

2

Comment appliquer des réseaux de neurones sur des problèmes de classification multi-labels?

La description: Soit le domaine problématique la classification de documents où il existe un ensemble de vecteurs de caractéristiques, chacun appartenant à 1 ou plusieurs classes. Par exemple, un document doc_1peut appartenir aux catégories Sportset English. Question: En utilisant le réseau de neurones pour la classification, quelle serait l'étiquette pour …

12 machine-learning neural-networks natural-language multilabel

Questions marquées «machine-learning»