Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

14
Algorithme simple pour la détection des valeurs aberrantes en ligne d'une série chronologique générique
Je travaille avec une grande quantité de séries chronologiques. Ces séries temporelles sont essentiellement des mesures de réseau toutes les 10 minutes, et certaines sont périodiques (c'est-à-dire la bande passante), d'autres pas (c'est-à-dire la quantité de trafic de routage). Je voudrais un algorithme simple pour faire une "détection des valeurs …





2
Compte tenu de la puissance des ordinateurs de nos jours, n'y a-t-il jamais une raison de faire un test du chi-carré plutôt que le test exact de Fisher?
Étant donné que le logiciel peut maintenant calculer le test exact de Fisher si facilement de nos jours , existe-t-il des circonstances dans lesquelles, théoriquement ou pratiquement, le test du khi-carré est réellement préférable au test exact de Fisher? Les avantages du test exact de Fisher incluent: mise à l'échelle …


9
Qu'est-ce qu'un intervalle de confiance?
Je sais approximativement et officieusement ce qu'est un intervalle de confiance. Cependant, je n'arrive pas à comprendre un détail assez important: selon Wikipedia: Un intervalle de confiance ne permet pas de prédire que la vraie valeur du paramètre a une probabilité particulière d’être dans l’intervalle de confiance compte tenu des …

9
Y a-t-il une explication intuitive à la multicolinéarité qui pose problème en régression linéaire?
Le wiki aborde les problèmes qui se posent lorsque la multicollinéarité est un problème en régression linéaire. Le problème fondamental est que la multicolinéarité aboutit à des estimations de paramètres instables, ce qui rend très difficile l'évaluation de l'effet des variables indépendantes sur les variables dépendantes. Je comprends les raisons …



24
Règles empiriques pour les statistiques «modernes»
J'aime le livre de G van Belle sur les règles statistiques statistiques , et dans une moindre mesure, les erreurs communes en statistique (et comment les éviter) de Phillip I Good et James W. Hardin. Ils traitent des pièges courants lors de l'interprétation des résultats d'études expérimentales et observationnelles et …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.