Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données



7
Comment choisir entre le test t et le test non paramétrique, par exemple Wilcoxon dans de petits échantillons
Certaines hypothèses peuvent être vérifiées à l'aide du test t de Student (peut-être à l'aide de la correction de Welch pour les variances inégales dans le cas à deux échantillons), ou par un test non paramétrique comme le test de Wilcoxon apparié signé, le test de Wilcoxon-Mann-Whitney U, ou le …


6
Est-il possible de former un réseau de neurones sans rétropropagation?
De nombreux ouvrages et tutoriels sur les réseaux de neurones consacrent beaucoup de temps à l'algorithme de rétropropagation, qui est essentiellement un outil permettant de calculer le gradient. Supposons que nous construisons un modèle avec ~ 10K paramètres / poids. Est-il possible d'exécuter l'optimisation à l'aide d'algorithmes d'optimisation sans gradient? …

2
Que savons-nous du piratage informatique «à l'état sauvage»?
La phrase p- achalandage (aussi: "dragage de données" , "espionnage" ou "pêche") fait référence à divers types de fautes statistiques dans lesquelles les résultats deviennent artificiellement statistiquement significatifs. Il existe de nombreuses façons d'obtenir un résultat "plus significatif", notamment, sans s'y limiter: analyser uniquement un sous-ensemble "intéressant" de données dans …


30
Quel livre recommanderiez-vous aux scientifiques non statisticiens?
Quel livre recommanderiez-vous aux scientifiques qui ne sont pas statisticiens? Une livraison claire est la plus appréciée. Ainsi que l'explication des techniques et méthodes appropriées pour des tâches typiques: analyse de séries chronologiques, présentation et agrégation de grands ensembles de données.
94 references 


6
Essentiels tests de vérification des données
Dans mon travail, je travaille souvent avec des ensembles de données d'autres personnes. Des non-experts m'apportent des données cliniques et je les aide à les résumer et à effectuer des tests statistiques. Le problème que je rencontre est que les ensembles de données que je suis amené sont presque toujours …



3
Comment calculez-vous la précision et le rappel pour la classification multiclass à l'aide de la matrice de confusion?
Je me demande comment calculer la précision et se rappeler en utilisant une matrice de confusion pour un problème de classification multi-classes. Plus précisément, une observation ne peut être affectée qu'à sa classe / étiquette la plus probable. Je voudrais calculer: Précision = TP / (TP + FP) Rappel = …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.