Questions marquées «data-mining»

L'exploration de données utilise des méthodes de l'intelligence artificielle dans un contexte de base de données pour découvrir des modèles inconnus auparavant. En tant que telles, les méthodes ne sont généralement pas supervisées. Il est étroitement lié mais pas identique à l'apprentissage automatique. Les tâches clés de l'exploration de données sont l'analyse des clusters, la détection des valeurs aberrantes et l'extraction des règles d'association.


12
Quelle est la différence entre l'exploration de données, les statistiques, l'apprentissage automatique et l'IA?
Quelle est la différence entre l'exploration de données, les statistiques, l'apprentissage automatique et l'IA? Serait-il juste de dire que ce sont 4 domaines qui tentent de résoudre des problèmes très similaires mais avec des approches différentes? Qu'ont-ils en commun et en quoi diffèrent-ils? S'il y avait une sorte de hiérarchie …

4
Kappa de Cohen en anglais clair
Je lis un livre de data mining qui mentionnait la statistique Kappa comme moyen d’évaluer les performances de prévision des classificateurs. Cependant, je ne peux tout simplement pas comprendre cela. J'ai aussi vérifié Wikipedia mais cela n'a pas aidé aussi: https://en.wikipedia.org/wiki/Cohen's_kappa . Comment le kappa de Cohen aide-t-il à évaluer …



7
La distance euclidienne n'est généralement pas bonne pour les données rares?
J'ai vu quelque part que les distances classiques (comme la distance euclidienne) deviennent faiblement discriminantes lorsque nous disposons de données multidimensionnelles et rares. Pourquoi? Avez-vous un exemple de deux vecteurs de données clairsemés où la distance euclidienne ne fonctionne pas bien? Dans ce cas, quelle similarité devrions-nous utiliser?

8
Des compétences difficiles à trouver chez les apprenants en machine?
Il semble que l’exploration de données et l’apprentissage automatique soient devenus si populaires qu’à présent presque tous les étudiants CS connaissent les classificateurs, le regroupement, la PNL statistique, etc. Ma question est la suivante: quelles compétences un fouisseur de données pourrait-il acquérir pour le rendre différent des autres? Pour faire …

8
Générer une variable aléatoire avec une corrélation définie avec une ou plusieurs variables existantes
Pour une étude de simulation , je dois générer des variables aléatoires qui montrent une corrélation prefined (population) à une variable existante .YYY J'ai examiné les Rpackages copulaet ceux CDVinequi peuvent produire des distributions multivariées aléatoires avec une structure de dépendance donnée. Cependant, il n'est pas possible de fixer l'une …








En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.