Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


3
Erreur absolue moyenne OU erreur quadratique moyenne?
Pourquoi utiliser l'erreur quadratique moyenne (RMSE) au lieu de l'erreur absolue moyenne (MAE)? salut J'ai étudié l'erreur générée dans un calcul - j'avais initialement calculé l'erreur en tant qu'erreur quadratique moyenne normalisée racine. En regardant de plus près, je vois les effets de la quadrature de l'erreur qui donne plus …
59 least-squares  mean  rms  mae 



6
Manière raisonnée de regrouper des variables catégoriques à plusieurs niveaux?
Quelles techniques sont disponibles pour regrouper (ou regrouper) plusieurs catégories en un petit nombre, dans le but de les utiliser comme entrée (prédicteur) dans un modèle statistique? Considérons une variable comme étudiant majeur (discipline choisie par un étudiant de premier cycle). Il est non ordonné et catégorique, mais il peut …

11
Casse-tête: Comment générer 7 nombres entiers avec une probabilité égale en utilisant une pièce biaisée qui a un pr (tête) = p?
C’est une question que j’ai trouvée sur Glassdoor : comment générer 7 nombres entiers avec une probabilité égale en utilisant une pièce de monnaie qui a un ?Pr(Head)=p∈(0,1)Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1) Fondamentalement, vous avez une pièce qui peut ou peut ne pas être juste, et c'est votre seul processus de génération …




1
Comprendre la courbe ROC
J'ai du mal à comprendre la courbe ROC. Existe-t-il un avantage / amélioration de l'aire sous la courbe ROC si je construis différents modèles à partir de chaque sous-ensemble unique de l'ensemble d'apprentissage et que je l'utilise pour produire une probabilité? Par exemple, si a les valeurs de , et …
57 r  roc 

1
Pourquoi la transformation de racine carrée est-elle recommandée pour les données de comptage?
Il est souvent recommandé de prendre la racine carrée lorsque vous avez des données de comptage. (Pour des exemples sur CV, voir la réponse de @ HarveyMotulsky ici ou celle de @ whuber ici .) Par contre, lors de l'ajustement d'un modèle linéaire généralisé avec une variable de réponse distribuée …


7
Des exemples où la méthode des moments peut battre le maximum de vraisemblance dans de petits échantillons?
Les estimateurs de maximum de vraisemblance (MLE) sont asymptotiquement efficaces; nous constatons le résultat pratique dans la mesure où elles donnent souvent de meilleurs résultats que les estimations fondées sur la méthode des moments (MoM) (lorsqu'elles diffèrent), même pour des échantillons de petite taille Ici, "mieux que" signifie "en général", …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.