Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données



5
Stratégies d'enseignement de la distribution d'échantillonnage
La version tl; dr Quelles stratégies réussies utilisez-vous pour enseigner la distribution d'échantillonnage (d'une moyenne d'échantillon, par exemple) au niveau de l'introduction au premier cycle? L'arrière-plan En septembre, j'enseignerai un cours d'introduction aux statistiques pour les étudiants de deuxième année en sciences sociales (principalement les sciences politiques et la sociologie) …


4
Optimisation des courbes précision-rappel sous déséquilibre de classe
J'ai une tâche de classification où j'ai un certain nombre de prédicteurs (dont l'un est le plus informatif), et j'utilise le modèle MARS pour construire mon classificateur (je suis intéressé par n'importe quel modèle simple, et utiliser glms à des fins d'illustration serait bien aussi). Maintenant, j'ai un énorme déséquilibre …




3
Comment définir rigoureusement la probabilité?
La probabilité pourrait être définie de plusieurs façons, par exemple: la fonction de qui mappe à ie .LLLΘ×XΘ×X\Theta\times{\cal X}(θ,x)(θ,x)(\theta,x)L(θ∣x)L(θ∣x)L(\theta \mid x)L:Θ×X→RL:Θ×X→RL:\Theta\times{\cal X} \rightarrow \mathbb{R} la fonction aléatoireL(⋅∣X)L(⋅∣X)L(\cdot \mid X) on pourrait aussi considérer que la vraisemblance n'est que la vraisemblance "observée"L(⋅∣xobs)L(⋅∣xobs)L(\cdot \mid x^{\text{obs}}) en pratique, la vraisemblance n'apporte des informations …

3
Visualiser les intersections de nombreux ensembles
Existe-t-il un modèle de visualisation permettant de montrer le chevauchement d'intersections de nombreux ensembles? Je pense à quelque chose comme les diagrammes de Venn, mais cela pourrait se prêter d'une manière ou d'une autre à un plus grand nombre d'ensembles tels que 10 ou plus. Wikipédia montre des diagrammes Venn …



6
Quand les intervalles de confiance sont-ils utiles?
Si je comprends bien, un intervalle de confiance d'un paramètre est un intervalle construit par une méthode qui donne des intervalles contenant la vraie valeur pour une proportion spécifiée d'échantillons. La «confiance» concerne donc la méthode plutôt que l'intervalle que je calcule à partir d'un échantillon particulier. En tant qu'utilisateur …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.