Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données







3
Pourquoi l'écart type de l'échantillon est-il un estimateur biaisé de ?
Selon l'article de Wikipedia sur l' estimation non biaisée de l'écart type, l'échantillon SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} est un estimateur biaisé du SD de la population. Il est écrit que .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB Les variables aléatoires sont indépendantes et chaquexi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) Ma question est …

7
Défis industrie vs Kaggle. Est-ce que collecter plus d'observations et avoir accès à plus de variables est plus important que la modélisation de fantaisie?
J'espère que le titre est explicite. Dans Kaggle, la plupart des gagnants utilisent l’empilement avec parfois des centaines de modèles de base pour réduire au minimum quelques points de pourcentage de MSE, de précision ... En général, selon votre expérience, l’importance de la modélisation sophistiquée telle que l’empilement par rapport …

9
Est-il erroné de reformuler «1 décès sur 80 est dû à un accident de voiture» car «1 personne sur 80 meurt des suites d'un accident de voiture?
Première déclaration (S1): "Un décès sur 80 est causé par un accident de voiture." Deuxième déclaration (S2): "Une personne sur 80 meurt des suites d'un accident de voiture." Personnellement, je ne vois pas beaucoup de différence entre ces deux déclarations. En écrivant, je les considèrerais comme interchangeables pour un public …






6
L ’« hybride »entre les approches de Fisher et de Neyman-Pearson en matière de test statistique est-il vraiment un« méli-mélo incohérent »?
Il existe une certaine école de pensée selon laquelle l'approche la plus répandue du test statistique est un "hybride" entre deux approches: celle de Fisher et celle de Neyman-Pearson; La revendication affirme que ces deux approches sont "incompatibles" et que, par conséquent, "hybride" est un "méli-mélo incohérent". Je fournirai une …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.