Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


3
Existe-t-il des cas où PCA est plus approprié que t-SNE?
Je veux voir comment 7 mesures du comportement de correction de texte (temps passé à corriger le texte, nombre de frappes au clavier, etc.) sont liées les unes aux autres. Les mesures sont corrélées. J'ai exécuté une ACP pour voir comment les mesures étaient projetées sur PC1 et PC2, ce …
39 pca  tsne 




4
Les covariables qui ne sont pas statistiquement significatives doivent-elles être «conservées» lors de la création d'un modèle?
Mon calcul comporte plusieurs covariables pour un modèle, et toutes ne sont pas statistiquement significatives. Devrais-je enlever ceux qui ne le sont pas? Cette question traite du phénomène, mais ne répond pas à ma question: comment interpréter l'effet non significatif d'une covariable dans ANCOVA? Rien dans la réponse à cette …



1
Comment interpréter et rapporter eta carré / partiel eta carré dans les analyses statistiquement significatives et non significatives?
J'ai des données qui ont des valeurs eta au carré et des valeurs partielles eta au carré calculées comme une mesure de la taille de l'effet pour les différences moyennes de groupe. Quelle est la difference entre eta squared et partial eta squared? Peuvent-ils tous deux être interprétés en utilisant …

2
Simulation d'analyse de puissance de régression logistique - expériences conçues
Cette question répond à une réponse donnée par @Greg Snow à une question que j’avais posée concernant l’analyse de puissance avec régression logistique et SAS Proc GLMPOWER. Si je conçois une expérience et que j'analyserai les résultats dans une régression logistique factorielle, comment puis-je utiliser la simulation (et ici ) …

4
Quel est le sens du "." (Point) dans R?
Je viens de lire le livre "R in a Nutshell". Et il semble que j'ai sauté la partie où le "." comme dans "sample.formula" a été expliqué. > sample.formula <- as.formula(y~x1+x2) Echantillon est-il un objet avec une formule de champ comme dans d’autres langues? Et si oui, comment puis-je savoir …
39 r 

6
Régression par le plus petit angle vs lasso
La régression aux angles moindres et le lasso tendent à produire des chemins de régularisation très similaires (identiques sauf lorsqu'un coefficient passe à zéro). Ils peuvent tous deux être ajustés efficacement par des algorithmes pratiquement identiques. Y a-t-il jamais une raison pratique de préférer une méthode à une autre?
39 regression  lasso 

3
Mode, classe et type d'objets R
Je me demandais quelles sont les différences entre les objets Mode, Classe et Type de R? Le type d'un objet R peut être obtenu par la fonction typeof (), mode par mode () et classe par classe (). Également d'autres fonctions et concepts similaires que j'ai manqués? Merci et salutations!
39 r 

3
Clojure versus R: avantages et inconvénients pour l'analyse de données
J'avais un plan d'apprentissage de R dans un proche avenir. En lisant une autre question, j'ai découvert Clojure. Maintenant je ne sais pas quoi faire. Je pense que l’un des grands avantages de R , c’est que certaines personnes en économie l’utilisent, y compris l’un de mes supérieurs hiérarchiques (bien …
39 r 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.