Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données

3
R caret et NAs
Je préfère de beaucoup le caret pour sa capacité de réglage des paramètres et son interface uniforme, mais j'ai observé qu'il nécessite toujours des ensembles de données complets (c'est-à-dire sans NA) même si le modèle "nu" appliqué autorise les NA. C'est très gênant, car il faut appliquer des méthodes d'imputation …

3
Pourquoi la régression bêta / dirichlet n'est pas considérée comme un modèle linéaire généralisé?
La prémisse est cette citation de la vignette du package R betareg1 . De plus, le modèle partage certaines propriétés (telles que le prédicteur linéaire, la fonction de lien, le paramètre de dispersion) avec les modèles linéaires généralisés (GLM; McCullagh et Nelder 1989), mais ce n'est pas un cas particulier …





1
Un contre tous et un contre un dans svm?
Quelle est la différence entre un classificateur SVM un contre un et un contre un? Est-ce que un contre un signifie un classificateur pour classer tous les types / catégories de la nouvelle image et un contre un signifie que chaque type / catégorie de nouvelle image se classe avec …

2
Pourquoi le LDA scikit-learn de Python ne fonctionne-t-il pas correctement et comment calcule-t-il le LDA via SVD?
J'utilisais l'analyse linéaire discriminante (LDA) de la scikit-learnbibliothèque d'apprentissage automatique (Python) pour réduire la dimensionnalité et j'étais un peu curieux des résultats. Je me demande maintenant ce que fait la LDA scikit-learnpour que les résultats soient différents, par exemple, d'une approche manuelle ou d'une LDA effectuée en R. Ce serait …


5
Explication intuitive de la convergence dans la distribution et de la convergence dans la probabilité
Quelle est la différence intuitive entre une variable aléatoire convergeant en probabilité et une variable aléatoire convergeant en distribution? J'ai lu de nombreuses définitions et équations mathématiques, mais cela n'aide pas vraiment. (Veuillez garder à l'esprit que je suis un étudiant de premier cycle étudiant en économétrie.) Comment une variable …

7
Test d'hypothèse de distribution - quel est l'intérêt de le faire si vous ne pouvez pas «accepter» votre hypothèse nulle?
Divers tests d'hypothèse, tels que le GOF, Kolmogorov-Smirnov, Anderson-Darling, etc., suivent ce format de base:χ2χ2\chi^{2} H0H0H_0 : Les données suivent la distribution donnée. H1H1H_1 : Les données ne suivent pas la distribution donnée. Typiquement, on évalue l'affirmation selon laquelle certaines données données suivent une distribution donnée, et si l'on rejette …



2
Estimer le quantile de valeur dans un vecteur
J'ai un ensemble de vrais nombres. J'ai besoin d'estimer le quantile d'un nouveau nombre. Existe-t-il un moyen propre de le faire dans R? en général? J'espère que ce n'est pas ultra-trivial ;-) Très apprécié pour votre réponse. PK
26 r 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.