Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données






4
Pourquoi l'attente est-elle la même chose que la moyenne arithmétique?
Aujourd'hui, je suis tombé sur un nouveau sujet appelé l'espérance mathématique. Dans le livre que je suis en train de suivre, l’attente est la moyenne arithmétique des variables aléatoires provenant de toute distribution de probabilité. Mais, il définit les attentes comme la somme du produit de certaines données et de …

2
Les splines surchargent-elles les données?
Mon problème : j'ai récemment rencontré un statisticien qui m'a informé que les splines ne sont utiles que pour explorer des données et sont sujettes à un surajustement, ce qui n'est donc pas utile pour la prédiction. Il préférait explorer avec des polynômes simples ... Comme je suis un grand …


4
Comment faire la sélection du sous-ensemble de régression logistique?
Je monte une famille de binômes dans R, et j'ai toute une troupe de variables explicatives, et j'ai besoin de trouver le meilleur (R au carré comme mesure, ça va). À part écrire un script pour parcourir différentes combinaisons aléatoires de variables explicatives et ensuite enregistrer qui donne les meilleurs …
47 r  logistic 

6
Tutoriel statistiques bayésiennes
J'essaie de prendre de la vitesse dans Bayesian Statistics. J'ai un peu de fond de statistiques (STAT 101) mais pas trop - je pense que je peux comprendre avant, après, et vraisemblance: D. Je ne veux pas lire un manuel bayésien pour l'instant. Je préférerais lire à partir d'une source …


15
Termes statistiques les plus déroutants
En tant que statisticiens, nous utilisons beaucoup de mots de manière légèrement différente de celle utilisée par tout le monde. Cela cause beaucoup de problèmes lorsque nous enseignons ou expliquons ce que nous faisons. Je vais commencer une liste (et maintenant je vais ajouter quelques définitions, par commentaires): Le pouvoir …



14
Clarification sur l'interprétation des intervalles de confiance?
Ma compréhension actuelle de la notion "intervalle de confiance avec le niveau de confiance 1−α1−α1 - \alpha " est que, si nous essayions de calculer plusieurs fois cet intervalle (chaque fois avec un nouvel échantillon), il contiendrait le paramètre correct 1−α1−α1 - \alpha de l'heure. Bien que je me rende …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.