Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
PCA et train / test split
J'ai un jeu de données pour lequel j'ai plusieurs jeux d'étiquettes binaires. Pour chaque ensemble d'étiquettes, je forme un classificateur, en l'évaluant par validation croisée. Je souhaite réduire la dimensionnalité à l'aide de l'analyse en composantes principales (ACP). Ma question est: Est-il possible d'effectuer l'APC une fois pour l'ensemble de …


5
Comment résoudre le paradoxe de Simpson?
Le paradoxe de Simpson est un casse-tête classique abordé dans les cours d'introduction aux statistiques dans le monde entier. Cependant, mon cours se contentait de noter simplement qu’un problème existait et n’apportait pas de solution. Je voudrais savoir comment résoudre le paradoxe. C’est-à-dire que, face au paradoxe de Simpson, où …

2
Quelle est la formule du R-carré ajustée dans lm dans R et comment doit-elle être interprétée?
Quelle est la formule exacte utilisée dans R lm() pour le R au carré ajusté? Comment puis-je l'interpréter? Formules ajustées au carré Il semble exister plusieurs formules pour calculer le R au carré ajusté. Formule de Wherry: 1−(1−R2)(n−1)(n−v)1−(1−R2)(n−1)(n−v)1-(1-R^2)\frac{(n-1)}{(n-v)} La formule de McNemar: 1−(1−R2)(n−1)(n−v−1)1−(1−R2)(n−1)(n−v−1)1-(1-R^2)\frac{(n-1)}{(n-v-1)} Formule du Seigneur: 1−(1−R2)(n+v−1)(n−v−1)1−(1−R2)(n+v−1)(n−v−1)1-(1-R^2)\frac{(n+v-1)}{(n-v-1)} Formule de Stein: …

7
Choix de variables à inclure dans un modèle de régression linéaire multiple
Je travaille actuellement à la construction d'un modèle utilisant une régression linéaire multiple. Après avoir manipulé mon modèle, je ne sais pas comment déterminer au mieux les variables à conserver et celles à supprimer. Mon modèle a commencé avec 10 prédicteurs pour le DV. Lors de l'utilisation des 10 prédicteurs, …


2
Qu'est-ce que la symétrie composée en anglais?
J'ai récemment réalisé qu'un modèle mixte avec un seul sujet comme facteur aléatoire et les autres facteurs comme facteurs fixes équivaut à une ANOVA lors de la définition de la structure corrélationnelle du modèle mixte sur une symétrie composée. Par conséquent, j'aimerais savoir ce que signifie la symétrie composée dans …

4
Justification du test d'hypothèse unilatéral
Je comprends les tests d’hypothèses bilatéraux. Vous avez (vs ). La est la probabilité que génère des données au moins aussi extrêmes que celles observées.H0:θ=θ0H0:θ=θ0H_0 : \theta = \theta_0H1=¬H0:θ≠θ0H1=¬H0:θ≠θ0H_1 = \neg H_0 : \theta \ne \theta_0pppθθ\theta Je ne comprends pas les tests d'hypothèses unilatéraux. Ici, H0:θ≤θ0H0:θ≤θ0H_0 : \theta\le\theta_0 (vs H1=¬H0:θ>θ0H1=¬H0:θ>θ0H_1 …


5
Qu'est-ce qu'un bon usage de la fonction 'commentaire' dans R?
Je viens de découvrir la commentfonction dans R. Exemple: x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) C'est la première fois que j'utilise cette fonction et je me demandais quelles en sont les utilisations courantes / utiles. Puisqu'il …
35 r 

6
approximatif en
Je me suis intéressé récemment à la simulation de Monte Carlo et je l’utilise pour approcher des constantes telles que ππ\pi (cercle à l’intérieur d’un rectangle, zone proportionnelle). Cependant, je suis incapable de penser à une méthode correspondante pour approximer la valeur de eee [nombre d'Euler] en utilisant l'intégration de …




1
Détection des valeurs aberrantes dans les séries chronologiques (LS / AO / TC) à l'aide du paquet tsoutliers en R. Comment représenter les valeurs aberrantes au format équation?
Commentaires: Tout d' abord je voudrais dire un grand merci à l' auteur du nouveau tsoutliers paquet qui met en œuvre de Chen et Liu séries temporelles de détection des valeurs aberrantes qui a été publiée dans le Journal de l'American Statistical Association en 1993 dans le logiciel Open Source …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.