Recherche d'une structure cachée (statistique) dans des données non étiquetées, y compris le regroupement et l'extraction d'entités pour la réduction de la dimensionnalité.
J'utilise R pour faire du clustering K-means. J'utilise 14 variables pour exécuter K-means Quelle est une jolie façon de tracer les résultats de K-means? Y a-t-il des implémentations existantes? Avoir 14 variables complique-t-il la représentation graphique des résultats? J'ai trouvé quelque chose appelé GGcluster qui a l'air cool mais qui …
Je comprends comment artificial neural network (ANN), peut être formé de manière supervisée à l’aide de backpropogation pour améliorer l’ajustement en diminuant l’erreur dans les prédictions. J'ai entendu dire qu'un ANN peut être utilisé pour un apprentissage non supervisé, mais comment peut-on le faire sans une fonction de coût quelconque …
Le codage clairsemé est défini comme l’apprentissage d’un ensemble trop complet de vecteurs de base pour représenter les vecteurs d’entrée (<- pourquoi voulons-nous cela). Quelles sont les différences entre le codage fragmenté et le codeur automatique? Quand utiliserons-nous le codage fragmenté et l'auto-codeur?
Cher tout le monde - J'ai remarqué quelque chose d'étrange que je ne peux pas expliquer, pouvez-vous? En résumé: l'approche manuelle pour calculer un intervalle de confiance dans un modèle de régression logistique et la fonction R confint()donnent des résultats différents. Je suis passé par la régression logistique appliquée de …
Je joue la classification hiérarchique des données que j'ai recueillies et traitées de la décharge de données reddit sur Google BigQuery. Mon processus est le suivant: Recevez les 1000 derniers articles dans / r / politique Rassemblez tous les commentaires Traiter les données et calculer une n x mmatrice de …
Enseignement supervisé 1) Un humain construit un classificateur basé sur des données d' entrée et de sortie 2) Ce classificateur est formé avec un ensemble de données de formation 3) Ce classificateur est testé avec un ensemble de données de test 4) Déploiement si le résultat est satisfaisant A utiliser …
Supposons que j'ai deux groupes de données, étiquetés A et B (contenant chacun par exemple 200 échantillons et 1 fonction), et je veux savoir s'ils sont différents. Je pourrais: a) effectuer un test statistique (par exemple un test t) pour voir s'ils sont statistiquement différents. b) utiliser l'apprentissage automatique supervisé …
Dans le contexte de l'apprentissage automatique, quelle est la différence entre apprentissage non supervisé apprentissage supervisé et apprentissage semi-supervisé? Et quelles sont les principales approches algorithmiques à examiner?
J'essaie de faire une analyse des séries chronologiques et je suis nouveau dans ce domaine. J'ai un décompte quotidien d'un événement de 2006-2009 et je veux y adapter un modèle de série chronologique. Voici les progrès que j'ai réalisés: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) L'intrigue résultante que j'obtiens est: Afin de …
J'ai quelques points dans R p , et je veux regrouper les points de sorte que:X= { x1, .. . , xn}X={X1,...,Xn}X=\{x_1,...,x_n\}RpRpR^p Chaque cluster contient un nombre égal d'éléments de . (Supposons que le nombre de clusters divise n .)XXXnnn Chaque grappe est "spatialement cohérente" dans un certain sens, comme …
La deuxième question est que j'ai trouvé dans une discussion quelque part sur le Web parler de "clustering supervisé", pour autant que je sache, le clustering n'est pas supervisé, alors quelle est exactement la signification derrière "clustering supervisé"? Quelle est la différence en ce qui concerne la "classification"? Il existe …
Quelles sont les différences entre les modèles génératifs et discriminants (discriminants) (dans le contexte de l'apprentissage et de l'inférence bayésienne)? et qu'est-ce qui concerne la prédiction, la théorie de la décision ou l'apprentissage sans supervision?
Par souci de simplicité, disons que je travaille sur l'exemple classique des e-mails spam / non-spam. J'ai un ensemble de 20000 e-mails. Parmi ceux-ci, je sais que 2000 sont du spam, mais je n'ai aucun exemple d'e-mails non-spam. Je voudrais prédire si les 18 000 restants sont du spam ou …
J'essaie de comprendre ce que signifie l'hypothèse multiple dans l'apprentissage semi-supervisé. Quelqu'un peut-il expliquer de manière simple? Je ne peux pas obtenir l'intuition derrière cela. Il dit que vos données se trouvent sur un collecteur de faible dimension intégré dans un espace de dimension supérieure. Je n'ai pas compris ce …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.