Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données







6
La «note moyenne» d'Amazon est-elle trompeuse?
Si je comprends bien, les évaluations de livre sur une échelle de 1 à 5 sont des scores de Likert. C'est-à-dire qu'un 3 pour moi peut ne pas être nécessairement un 3 pour quelqu'un d'autre. C'est une échelle ordinale IMO. Il ne faut pas vraiment utiliser les échelles ordinales mais …

1
Bootstrap contre jackknife
Les méthodes bootstrap et jackknife peuvent être utilisées pour estimer le biais et l’erreur type d’une estimation et les mécanismes des deux méthodes de ré-échantillonnage ne sont pas très différents: échantillonnage avec remplacement ou omission d’une observation à la fois. Toutefois, le jackknife n’est pas aussi populaire que le bootstrap …




4
Temps de calcul aléatoire de la forêt en R
J'utilise le package party en R avec 10 000 lignes et 34 fonctionnalités, et certaines fonctionnalités factorielles comportent plus de 300 niveaux. Le temps de calcul est trop long. (Cela a pris 3 heures jusqu'à présent et ce n'est pas fini.) Je veux savoir quels éléments ont un effet important …
49 r  random-forest 




En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.