Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


6
Vidéos statistiques / probabilités pour débutants
Il y avait déjà une demande de vidéos de statistiques mathématiques , mais elle demandait explicitement aux des vidéos qui fournissent une présentation mathématique rigoureuse des statistiques. c'est-à-dire des vidéos qui pourraient accompagner un cours qui utilisent un manuel mentionné dans cette discussion sur ... Alors en même temps je …
28 references 





6
Quelles sont les alternatives aux axes cassés?
Les utilisateurs sont souvent tentés de casser les valeurs des axes pour présenter des données de différents ordres de grandeur sur le même graphique (voir ici ). Bien que cela puisse être pratique, ce n'est pas toujours la manière préférée d'afficher les données (peut être trompeuse au mieux). Quelles sont …

4
Une adaptation de la distance Kullback-Leibler?
Regarde cette image: Si nous tirons un échantillon de la densité rouge, alors certaines valeurs devraient être inférieures à 0,25 alors qu'il est impossible de générer un tel échantillon à partir de la distribution bleue. Par conséquent, la distance de Kullback-Leibler de la densité rouge à la densité bleue est …

26
Quels packages R trouvez-vous les plus utiles dans votre travail quotidien?
Verrouillé . Cette question et ses réponses sont verrouillées car la question est hors sujet mais a une signification historique. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Fil en double: je viens d'installer la dernière version de R. Quels packages dois-je obtenir? Quels sont les packages R que …
28 r 

2
Pourquoi l'erreur quadratique moyenne est-elle l'entropie croisée entre la distribution empirique et un modèle gaussien?
Dans 5.5, Deep Learning (par Ian Goodfellow, Yoshua Bengio et Aaron Courville), il déclare que Toute perte constituée d'une log-vraisemblance négative est une entropie croisée entre la distribution empirique définie par l'ensemble d'apprentissage et la distribution de probabilité définie par le modèle. Par exemple, l'erreur quadratique moyenne est l'entropie croisée …

4
Pourquoi utiliser colormap viridis sur jet?
Comme annoncé dans https://www.youtube.com/watch?v=xAoljeRJ3lU , Matplotlib change la palette de couleurs par défaut de jet en viridis. Cependant, je ne le comprends pas très bien. Peut-être parce que je suis daltonien? Le jet de palette de couleurs d'origine a l'air très fort, je peux sentir le contraste: Alors que la …

1
Papiers magnifiquement écrits
Extrait du livre de David Salsburg The lady tasting tea : Bien que le lecteur ne puisse pas le croire, le style littéraire joue un rôle important dans la recherche mathématique. Certains auteurs mathématiques semblent incapables de produire des articles faciles à comprendre. D'autres semblent avoir un plaisir pervers à …


6
Pourquoi avons-nous besoin d'une régression multivariée (par opposition à un tas de régressions univariées)?
Je viens de parcourir ce merveilleux livre: Analyse statistique multivariée appliquée par Johnson et Wichern . L'ironie est que je ne suis toujours pas en mesure de comprendre la motivation pour utiliser des modèles multivariés (régression) au lieu de modèles univariés (régression) séparés. J'ai parcouru les publications stats.statexchange 1 et …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.