Statistiques et Big Data

Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données


4
Choix entre LM et GLM pour une variable de réponse transformée par un journal
J'essaie de comprendre la philosophie qui sous-tend l'utilisation d'un modèle linéaire généralisé (GLM) par rapport à un modèle linéaire (LM). J'ai créé un exemple de jeu de données ci-dessous où: bûche( y) = x + εbûche⁡(y)=X+ε\log(y) = x + \varepsilon L'exemple n'a pas l'erreur en fonction de la magnitude de …

9
Recommandation de livres de statistiques avancées
Il existe plusieurs discussions sur ce site pour des recommandations de livres sur les statistiques d’introduction et l’apprentissage automatique, mais je cherche un texte sur les statistiques avancées, comprenant, par ordre de priorité: maximum de vraisemblance, modèles linéaires généralisés, analyse en composantes principales, modèles non linéaires . J'ai essayé les …




7
Quelle mesure pseudo- est celle à déclarer pour la régression logistique (Cox & Snell ou Nagelkerke)?
J'ai une SPSSsortie pour un modèle de régression logistique. La sortie indique deux mesures pour l'ajustement du modèle, Cox & Snellet Nagelkerke. Donc, en règle générale, laquelle de ces mesures R2R²R^² rapporteriez-vous comme ajustement du modèle? Ou, lequel de ces indices d'ajustement est celui qui est habituellement rapporté dans les …

5
Théorème central limite pour les médianes d'échantillon
Si je calcule la médiane d'un nombre suffisamment grand d'observations tirées de la même distribution, le théorème limite central énonce-t-il que la distribution des médianes se rapprochera d'une distribution normale? Si j'ai bien compris, cela est vrai avec les moyennes d'un grand nombre d'échantillons, mais est-ce aussi vrai avec les …


3
Comprendre la validation croisée stratifiée
Quelle est la différence entre la validation croisée stratifiée et la validation croisée ? Wikipedia dit: Dans la validation croisée des plis en k , les plis sont sélectionnés de sorte que la valeur de réponse moyenne soit approximativement égale dans tous les plis. Dans le cas d'une classification dichotomique, …

5
Utilisation de l'apprentissage en profondeur pour la prédiction de séries chronologiques
Je suis nouveau dans le domaine de l'apprentissage en profondeur et pour moi, la première étape a été de lire des articles intéressants sur le site deeeplearning.net. Dans des articles sur l'apprentissage en profondeur, Hinton et d'autres discutent principalement de l'appliquer à des problèmes d'image. Quelqu'un peut-il essayer de me …

2
Question de base sur la matrice d'information de Fisher et sa relation avec les erreurs standard et de hesse
Ok, c'est une question assez fondamentale, mais je suis un peu confus. Dans ma thèse j'écris: Les erreurs types peuvent être trouvées en calculant l'inverse de la racine carrée des éléments diagonaux de la matrice (observée) de Fisher Information: -logLI(μ,σ2)=H-1sμ^,σ^2=1I(μ^,σ^2)−−−−−−√sμ^,σ^2=1I(μ^,σ^2)\begin{align*} s_{\hat{\mu},\hat{\sigma}^2}=\frac{1}{\sqrt{\mathbf{I}(\hat{\mu},\hat{\sigma}^2)}} \end{align*} Etant donné que la commande d'optimisation dans R …

2
Exemples réels de processus de moyenne mobile
Pouvez-vous donner des exemples concrets de séries chronologiques pour lesquelles un processus de moyenne mobile d'ordre , c.-à-d. a-t-il une raison a priori d'être un bon modèle? Au moins pour moi, les processus autorégressifs semblent assez faciles à comprendre intuitivement, alors que les processus MA ne semblent pas aussi naturels …

9
Comment R et Python se complètent-ils en data science?
Dans de nombreux tutoriels ou manuels, le récit semble impliquer que R et python coexistent en tant que composants complémentaires du processus d'analyse. À mes yeux, cependant, il semble que les deux langues fassent en quelque sorte la même chose. Ma question est donc de savoir s’il existe des créneaux …
54 r  python  software 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.