Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données







2
Méthodes de rééchantillonnage du caret
J'utilise la bibliothèque careten R pour tester différentes procédures de modélisation. L' trainControlobjet permet de spécifier une méthode de rééchantillonnage. Les méthodes sont décrites dans la documentation section 2.3 et comprennent: boot, boot632, cv, LOOCV, LGOCV, repeatedcvet oob. Bien que certaines d'entre elles soient faciles à déduire, toutes ces méthodes …
20 r  resampling  caret 



6
Quand supprimer un terme d'un modèle de régression?
Quelqu'un pourrait-il indiquer si ce qui suit est logique: J'ai affaire à un modèle linéaire ordinaire avec 4 prédicteurs. Je suis dans deux esprits s'il faut abandonner le terme le moins significatif. Sa valeur est un peu plus de 0,05. J'ai plaidé en faveur de l'abandon dans ces conditions: multiplier …

8
Des idées pour le logiciel «cahier de laboratoire»?
C'est donc un ajustement étrange, bien que je pense vraiment que c'est un ajustement étrange pour n'importe quel site, alors j'ai pensé l'essayer ici, parmi mes frères qui croient les données. Je suis arrivé à l'épidémiologie et à la biostatistique de la biologie, et j'ai certainement encore des habitudes dans …





En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.