Questions marquées «data-mining»

L'exploration de données utilise des méthodes de l'intelligence artificielle dans un contexte de base de données pour découvrir des modèles inconnus auparavant. En tant que telles, les méthodes ne sont généralement pas supervisées. Il est étroitement lié mais pas identique à l'apprentissage automatique. Les tâches clés de l'exploration de données sont l'analyse des clusters, la détection des valeurs aberrantes et l'extraction des règles d'association.


5
Mesure de levage dans l'exploration de données
J'ai cherché de nombreux sites Web pour savoir ce que ferait exactement l'ascenseur? Les résultats que j'ai trouvés concernaient tous son utilisation dans des applications autres que celles-ci. Je connais la fonction de support et de confiance. D'après Wikipédia, dans l'exploration de données, l'ascenseur est une mesure de la performance …

5
Pensez comme un bayésien, vérifiez comme un fréquentiste: qu'est-ce que cela signifie?
Je regarde des diapositives de cours sur un cours de science des données que vous pouvez trouver ici: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Malheureusement, je ne peux pas voir la vidéo de cette conférence et à un moment de la diapositive, le présentateur a le texte suivant: Quelques principes clés Penser comme un Bayésien, …

3




8
Quelles matières mathématiques suggéreriez-vous pour préparer l'exploration de données et l'apprentissage automatique?
J'essaie de mettre en place un programme de mathématiques autogéré pour préparer l'apprentissage du data mining et du machine learning. Cela est motivé par le démarrage du cours d'apprentissage automatique d'Andrew Ng sur Coursera et le sentiment qu'avant de continuer, je devais améliorer mes compétences en mathématiques. J'ai obtenu mon …

2
Pourquoi les valeurs de p sont-elles trompeuses après avoir effectué une sélection pas à pas?
Prenons par exemple un modèle de régression linéaire. J'ai entendu dire que, dans l'exploration de données, après avoir effectué une sélection par étapes basée sur le critère AIC, il est trompeur de regarder les valeurs de p pour tester l'hypothèse nulle selon laquelle chaque véritable coefficient de régression est nul. …


9
Outils logiciels de statistiques et d'exploration de données pour gérer de grands ensembles de données
Actuellement, je dois analyser environ 20 millions d'enregistrements et créer des modèles de prédiction. Jusqu'à présent, j'ai essayé Statistica, SPSS, RapidMiner et R. Parmi ces Statistica semble être le plus approprié pour faire face à l'exploration de données et l'interface utilisateur de RapidMiner est également très pratique, mais il semble …


3
LSA contre PCA (regroupement de documents)
J'étudie différentes techniques utilisées dans le clustering de documents et je voudrais dissiper certains doutes concernant PCA (analyse en composantes principales) et LSA (analyse sémantique latente). Première chose - quelles sont les différences entre eux? Je sais qu'en PCA, la décomposition SVD est appliquée à la matrice terme-covariance, tandis qu'en …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.