Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


3
Existe-t-il un problème d'apprentissage supervisé empêchant les réseaux de neurones (profonds) de surpasser les autres méthodes?
J'ai vu des gens mettre beaucoup d'efforts sur SVM et les noyaux, et ils ont l'air très intéressants en tant que débutants en Machine Learning. Mais si nous nous attendons à ce que nous puissions presque toujours trouver une solution plus performante en termes de réseau de neurones (profonds), quelle …



2
Trouver des quartiles en R
Je travaille sur un manuel de statistiques tout en apprenant R et je suis tombé sur une pierre d'achoppement sur l'exemple suivant: Après avoir regardé, ?quantilej'ai essayé de recréer ceci dans R avec ce qui suit: > nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, …
33 r  quantiles 

1
Quelle est la raison intuitive derrière les rotations dans l'analyse factorielle / ACP et comment sélectionner la rotation appropriée?
Mes questions Quelle est la raison intuitive derrière la rotation des facteurs dans l'analyse factorielle (ou des composants de la PCA)? D'après ce que je comprends, si les variables sont presque également chargées dans les principaux composants (ou facteurs), il est évidemment difficile de différencier les composants. Donc, dans ce …

2
Différences entre la distance de Bhattacharyya et la divergence KL
Je cherche une explication intuitive pour les questions suivantes: En statistique et en théorie de l’information, quelle est la différence entre la distance de Bhattacharyya et la divergence de KL, en tant que mesures de la différence entre deux distributions de probabilité discrètes? Ont-ils absolument aucune relation et mesurent-ils la …

8
Est-il possible de supprimer les données aberrantes des données?
J'ai cherché un moyen de supprimer les valeurs aberrantes d'un jeu de données et j'ai trouvé cette question . Cependant, dans certains commentaires et réponses à cette question, certaines personnes ont indiqué qu’il était de mauvaise pratique de supprimer les données aberrantes des données. Dans mon jeu de données, j'ai …
33 outliers 





4
Origine du seuil «5
Selon des reportages, le CERN annoncera demain que le boson de Higgs a été détecté de manière expérimentale avec des preuves de 5 . Selon cet article:σσ\sigma 5 équivaut à 99,99994% des chances que les données détectées par les détecteurs CMS et ATLAS ne soient pas que du bruit aléatoire …

1
Comment former et valider un modèle de réseau neuronal en R?
Je suis novice en modélisation avec les réseaux de neurones, mais j’ai réussi à établir un réseau de neurones avec tous les points de données disponibles qui correspond bien aux données observées. Le réseau de neurones a été réalisé en R avec le paquet nnet: require(nnet) ##33.8 is the highest …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.