Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données



2
«Intention de l'investigateur» et seuils / valeurs p
Je lis les diapositives "Faire une analyse des données bayésiennes" de John Kruschke , mais j'ai en fait une question sur son interprétation des tests t et / ou de l'ensemble du cadre de test de signification d'hypothèse nulle. Il soutient que les valeurs de p sont mal définies car …


5
Réseaux de neurones modernes qui construisent leur propre topologie
Une limitation des algorithmes de réseau neuronal standard (comme backprop) est que vous devez prendre une décision de conception du nombre de couches cachées et de neurones par couche que vous voulez. Habituellement, le taux d'apprentissage et la généralisation sont très sensibles à ces choix. C'est la raison pour laquelle …


5
Quelle est la bonne façon de tester la signification des résultats de la classification
Il existe de nombreuses situations où vous pouvez former plusieurs classificateurs différents ou utiliser plusieurs méthodes d'extraction de fonctionnalités différentes. Dans la littérature, les auteurs donnent souvent l'erreur de classification moyenne sur un ensemble de divisions aléatoires des données (c'est-à-dire après une validation croisée doublement imbriquée), et donnent parfois aussi …


3
Régression vs écart ANOVA (aov vs lm dans R)
J'ai toujours eu l'impression que la régression n'est qu'une forme plus générale d'ANOVA et que les résultats seraient identiques. Récemment, cependant, j'ai effectué une régression et une ANOVA sur les mêmes données et les résultats diffèrent considérablement. Autrement dit, dans le modèle de régression, les effets principaux et l'interaction sont …
21 r  regression  anova 


3
Pourquoi devrions-nous nous soucier du mélange rapide dans les chaînes MCMC?
Lorsque nous travaillons avec la chaîne de Markov Monte Carlo pour tirer l'inférence, nous avons besoin d'une chaîne qui se mélange rapidement, c'est-à-dire qui traverse rapidement le support de la distribution postérieure. Mais je ne comprends pas pourquoi nous avons besoin de cette propriété, car d'après ce que je comprends, …
21 mcmc 



4
Quelle est la malédiction de la dimensionnalité?
Plus précisément, je recherche des références (articles, livres) qui montreront et expliqueront rigoureusement la malédiction de la dimensionnalité. Cette question s'est posée après que j'ai commencé à lire ce livre blanc de Lafferty et Wasserman. Dans le troisième paragraphe, ils mentionnent une équation "bien connue" qui implique que le meilleur …
21 theory 

4
Que signifie «impartialité»?
Que signifie dire que "la variance est un estimateur biaisé". Que signifie convertir une estimation biaisée en une estimation non biaisée au moyen d'une formule simple. Que fait exactement cette conversion? Aussi, quelle est l'utilité pratique de cette conversion? Convertissez-vous ces scores lorsque vous utilisez certains types de statistiques?

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.