Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


7
Pourquoi quelqu'un utiliserait-il une approche bayésienne avec un précédent non approprié «non informatif» au lieu de l'approche classique?
Si l’intérêt consiste simplement à estimer les paramètres d’un modèle (estimation ponctuelle et / ou par intervalle) et que les informations préalables ne sont pas fiables, faibles (je sais que cela est un peu vague, mais j’essaie d’établir un scénario où a priori est difficile) ... Pourquoi quelqu'un choisirait-il d'utiliser …


4
Aide-mémoire des modèles statistiques
Je me demandais s'il existe un modèle statistique "aide-mémoire" qui répertorie des informations supplémentaires: quand utiliser le modèle quand ne pas utiliser le modèle entrées obligatoires et optionnelles résultats attendus Le modèle a-t-il été testé dans différents domaines (politique, bio, ingénierie, fabrication, etc.)? est-ce accepté en pratique ou en recherche? …

8
Définition rigoureuse d'une valeur aberrante?
Les gens parlent souvent de faire face aux valeurs aberrantes dans les statistiques. Ce qui me dérange à ce propos, c’est que, pour autant que je sache, la définition d’une valeur aberrante est complètement subjective. Par exemple, si la distribution réelle d'une variable aléatoire est très lourde ou bimodale, toute …


6
Pourquoi la multicolinéarité n'est-elle pas vérifiée dans les statistiques modernes / l'apprentissage automatique?
Dans les statistiques traditionnelles, lors de la construction d'un modèle, nous vérifions la multicolinéarité à l'aide de méthodes telles que les estimations du facteur d'inflation de la variance (VIF), mais en apprentissage automatique, nous utilisons plutôt la régularisation pour la sélection des caractéristiques et ne semblons pas vérifier si les …



4
Comment comparer statistiquement deux séries chronologiques?
J'ai deux séries chronologiques, montrées dans l'intrigue ci-dessous: Le graphique montre les détails complets des deux séries chronologiques, mais je peux facilement le réduire aux observations coïncidentes si nécessaire. Ma question est la suivante: quelles méthodes statistiques puis-je utiliser pour évaluer les différences entre les séries chronologiques? Je sais que …
44 r  time-series 


4
Quelle fonction d'activation pour la couche de sortie?
Alors que le choix des fonctions d'activation pour la couche cachée est assez clair (principalement sigmoïde ou tanh), je me demande comment décider de la fonction d'activation pour la couche en sortie. Les choix courants sont les fonctions linéaires, les fonctions sigmoïdes et les fonctions softmax. Cependant, quand devrais-je utiliser …




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.