Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


2
Comparer les splines de lissage et le loess pour le lissage?
Je souhaite mieux comprendre les avantages / inconvénients de l'utilisation de loess ou d'un spline de lissage pour lisser une courbe. Une autre variation de ma question est de savoir s'il existe un moyen de construire une spline de lissage d'une manière qui produira les mêmes résultats que l'utilisation du …

4
Ziliak (2011) s'oppose à l'utilisation des valeurs de p et mentionne certaines alternatives; que sont-ils?
Dans un article récent sur les inconvénients de s'appuyer sur la valeur p pour l'inférence statistique, intitulé "Matrixx c. Siracusano et Student c. Fisher Statistical d'importance on trial" (DOI: 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak s'oppose à l'utilisation des valeurs de p. Dans les derniers paragraphes, il dit: Les données …

5
Pourquoi utiliser la méthode Monte Carlo au lieu d'une simple grille?
lors de l'intégration d'une fonction ou dans des simulations complexes, j'ai vu que la méthode de Monte Carlo est largement utilisée. Je me demande pourquoi on ne génère pas une grille de points pour intégrer une fonction au lieu de dessiner des points aléatoires. Cela n'apporterait-il pas des résultats plus …



6
Quelles sont les bonnes techniques de visualisation des données pour comparer les distributions?
J'écris ma thèse de doctorat et je me suis rendu compte que je m'appuie excessivement sur les boîtes à moustaches pour comparer les distributions. Quelles autres alternatives aimez-vous pour accomplir cette tâche? J'aimerais également vous demander si vous connaissez une autre ressource comme la galerie R dans laquelle je peux …

4
Aborder l'incertitude du modèle
Je me demandais comment les Bayésiens de la communauté CrossValidated perçoivent le problème de l' incertitude du modèle et comment ils préfèrent y faire face? Je vais essayer de poser ma question en deux parties: Dans quelle mesure (selon votre expérience / votre opinion) traite-t-on de l'incertitude du modèle? Je …


2
L'ACP est-elle instable en multicolinéarité?
Je sais que dans une situation de régression, si vous avez un ensemble de variables hautement corrélées, cela est généralement "mauvais" en raison de l'instabilité des coefficients estimés (la variance va vers l'infini car le déterminant va vers zéro). Ma question est de savoir si cette «méchanceté» persiste dans une …





2
Test du rapport de vraisemblance dans R
Supposons que je vais faire une régression logistique univariée sur plusieurs variables indépendantes, comme ceci: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) J'ai fait une comparaison de modèle (test de rapport de vraisemblance) pour voir si le modèle est meilleur que le modèle …
25 r  logistic  diagnostic 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.