Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

2
Comment mettre en commun les moyennes postérieures et les intervalles crédibles après imputation multiple?
J'ai utilisé l'imputation multiple pour obtenir un certain nombre de jeux de données terminés. J'ai utilisé des méthodes bayésiennes sur chacun des ensembles de données terminés pour obtenir des distributions postérieures pour un paramètre (un effet aléatoire). Comment puis-je combiner / regrouper les résultats de ce paramètre? Plus de contexte: …

3
Comment interpréter les coefficients de régression lorsque la réponse a été transformée par la 4ème racine?
J'utilise la quatrième 1/4transformation de puissance root ( ) sur ma variable de réponse, en raison de l'hétéroscédasticité. Mais maintenant, je ne sais pas comment interpréter mes coefficients de régression. Je suppose que j'aurais besoin de prendre les coefficients à la quatrième puissance lors de la rétrotransformation (voir ci-dessous la …

3
Statistiques élémentaires pour les jurés
J'ai été convoqué pour un jury. Je suis conscient de la pertinence des statistiques pour certains procès devant jury. Par exemple, le concept de "taux de base" et son application aux calculs de probabilité est parfois - peut-être toujours - pertinent. Quels sujets statistiques une personne dans ma situation pourrait-elle …


5
Test t apparié versus non apparié
Supposons que j'ai 20 souris. J'appaire les souris d'une manière ou d'une autre, de sorte que j'obtienne 10 paires. Aux fins de cette question, il pourrait s'agir d'un appariement aléatoire, OU il pourrait s'agir d'un appariement sensé, comme essayer d'associer des souris de la même portée, du même sexe, avec …

6
«Entièrement bayésien» vs «Bayésien»
J'ai appris les statistiques bayésiennes et j'ai souvent lu des articles "nous adoptons une approche bayésienne" ou quelque chose de similaire. J'ai aussi remarqué, moins souvent: "nous adoptons une approche entièrement bayésienne" (c'est moi qui souligne). Y a-t-il une différence entre ces approches dans un sens pratique ou théorique? FWIW, …
20 bayesian 



2
Simulation de séries temporelles en fonction de la puissance et des densités spectrales croisées
J'ai du mal à générer un ensemble de séries temporelles colorées stationnaires, étant donné leur matrice de covariance (leurs densités spectrales de puissance (PSD) et leurs densités spectrales de puissance croisée (CSD)). Je sais que, compte tenu de deux séries chronologiques yje( t )yje(t)y_{I}(t) et yJ( t )yJ(t)y_{J}(t) , je …

1
Erreur dans l'approximation normale d'une distribution de somme uniforme
Une méthode naïve pour approximer une distribution normale consiste à additionner peut-être variables aléatoires IID uniformément réparties sur , puis plus récentes et redimensionnées, en s'appuyant sur le théorème de la limite centrale. ( Remarque : il existe des méthodes plus précises telles que la transformée de Box – Muller …


6
PCA de données non gaussiennes
J'ai quelques questions rapides sur PCA: L'ACP suppose- t-elle que l'ensemble de données est gaussien? Que se passe-t-il lorsque j'applique une PCA à des données intrinsèquement non linéaires? Étant donné un ensemble de données, le processus consiste d'abord à normaliser la moyenne, à définir la variance sur 1, à prendre …
20 pca  svd 

6
Modification de l'échelle d'une variable à 0-100
J'ai construit un indice de capital social en utilisant la technique PCA. Cet indice comprend des valeurs à la fois positives et négatives. Je veux transformer / convertir cet index en échelle 0-100 pour le rendre facile à interpréter. Veuillez me suggérer un moyen le plus simple de le faire.


2
AdaBoost est-il moins ou plus sujet au sur-ajustement?
J'ai lu diverses déclarations (apparemment) contradictoires, que AdaBoost (ou d'autres techniques de boosting) soient ou non sujettes à un sur-ajustement par rapport à d'autres méthodes d'apprentissage. Y a-t-il de bonnes raisons de croire l'un ou l'autre? Si cela dépend, de quoi dépend-il? Quelles sont les raisons pour lesquelles AdaBoost est …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.