Statistiques et Big Data

3

Qu'est-ce qui est si cool dans le théorème de représentation de De Finetti?

De la théorie de la statistique par Mark J. Schervish (page 12): Bien que le théorème de représentation 1.49 de DeFinetti soit essentiel à la motivation des modèles paramétriques, il n'est pas réellement utilisé dans leur mise en œuvre. Comment le théorème est-il au cœur des modèles paramétriques?

55 probability modeling mathematical-statistics parametric

4

Choix entre LM et GLM pour une variable de réponse transformée par un journal

J'essaie de comprendre la philosophie qui sous-tend l'utilisation d'un modèle linéaire généralisé (GLM) par rapport à un modèle linéaire (LM). J'ai créé un exemple de jeu de données ci-dessous où: bûche( y) = x + εbûche⁡(y)=X+ε\log(y) = x + \varepsilon L'exemple n'a pas l'erreur en fonction de la magnitude de …

55 r generalized-linear-model linear-model gamma-distribution link-function

9

Recommandation de livres de statistiques avancées

Il existe plusieurs discussions sur ce site pour des recommandations de livres sur les statistiques d’introduction et l’apprentissage automatique, mais je cherche un texte sur les statistiques avancées, comprenant, par ordre de priorité: maximum de vraisemblance, modèles linéaires généralisés, analyse en composantes principales, modèles non linéaires . J'ai essayé les …

55 generalized-linear-model pca maximum-likelihood references saddlepoint-approximation

3

Questions sur la manière dont les effets aléatoires sont spécifiés dans lmer

J'ai récemment mesuré la façon dont le sens d'un nouveau mot est acquis au cours d'expositions répétées (pratique: du premier au dixième jour) en mesurant les ERP (EEG) lorsque le mot a été vu dans différents contextes. J'ai également contrôlé les propriétés du contexte, par exemple son utilité pour la …

55 r mixed-model lme4-nlme random-effects-model

3

Critique de la théorie de la causalité de Pearl

En l'an 2000, Judea Pearl a publié Causality . Quelles controverses entourent ce travail? Quelles sont ses principales critiques?

55 causality

6

Alternatives à la régression logistique dans R

Je voudrais autant d’algorithmes effectuant la même tâche que la régression logistique. Ce sont des algorithmes / modèles qui peuvent donner une prédiction à une réponse binaire (Y) avec une variable explicative (X). Je serais heureux si, après avoir nommé l'algorithme, vous montriez également comment l'implémenter dans R. Voici un …

55 r regression logistic classification predictive-models

7

Quelle mesure pseudo- est celle à déclarer pour la régression logistique (Cox & Snell ou Nagelkerke)?

J'ai une SPSSsortie pour un modèle de régression logistique. La sortie indique deux mesures pour l'ajustement du modèle, Cox & Snellet Nagelkerke. Donc, en règle générale, laquelle de ces mesures R2R²R^² rapporteriez-vous comme ajustement du modèle? Ou, lequel de ces indices d'ajustement est celui qui est habituellement rapporté dans les …

55 logistic goodness-of-fit r-squared

5

Théorème central limite pour les médianes d'échantillon

Si je calcule la médiane d'un nombre suffisamment grand d'observations tirées de la même distribution, le théorème limite central énonce-t-il que la distribution des médianes se rapprochera d'une distribution normale? Si j'ai bien compris, cela est vrai avec les moyennes d'un grand nombre d'échantillons, mais est-ce aussi vrai avec les …

55 normal-distribution mathematical-statistics sampling median central-limit-theorem

2

Qu'est-ce que la couche de pooling maximale globale et quel est son avantage par rapport à la couche de covoiturage maxi?

Quelqu'un peut-il expliquer ce qu'est une couche de pooling maximum global et pourquoi et quand l'utilisons-nous pour la formation d'un réseau de neurones? Ont-ils un avantage sur la couche de pooling ordinaire?

55 neural-networks conv-neural-network pooling

3

Comprendre la validation croisée stratifiée

Quelle est la différence entre la validation croisée stratifiée et la validation croisée ? Wikipedia dit: Dans la validation croisée des plis en k , les plis sont sélectionnés de sorte que la valeur de réponse moyenne soit approximativement égale dans tous les plis. Dans le cas d'une classification dichotomique, …

55 cross-validation stratification

5

Utilisation de l'apprentissage en profondeur pour la prédiction de séries chronologiques

Je suis nouveau dans le domaine de l'apprentissage en profondeur et pour moi, la première étape a été de lire des articles intéressants sur le site deeeplearning.net. Dans des articles sur l'apprentissage en profondeur, Hinton et d'autres discutent principalement de l'appliquer à des problèmes d'image. Quelqu'un peut-il essayer de me …

54 time-series machine-learning prediction deep-learning deep-belief-networks

2

Question de base sur la matrice d'information de Fisher et sa relation avec les erreurs standard et de hesse

Ok, c'est une question assez fondamentale, mais je suis un peu confus. Dans ma thèse j'écris: Les erreurs types peuvent être trouvées en calculant l'inverse de la racine carrée des éléments diagonaux de la matrice (observée) de Fisher Information: -logLI(μ,σ2)=H-1sμ^,σ^2=1I(μ^,σ^2)−−−−−−√sμ^,σ^2=1I(μ^,σ^2)\begin{align*} s_{\hat{\mu},\hat{\sigma}^2}=\frac{1}{\sqrt{\mathbf{I}(\hat{\mu},\hat{\sigma}^2)}} \end{align*} Etant donné que la commande d'optimisation dans R …

54 maximum-likelihood fisher-information

2

Exemples réels de processus de moyenne mobile

Pouvez-vous donner des exemples concrets de séries chronologiques pour lesquelles un processus de moyenne mobile d'ordre , c.-à-d. a-t-il une raison a priori d'être un bon modèle? Au moins pour moi, les processus autorégressifs semblent assez faciles à comprendre intuitivement, alors que les processus MA ne semblent pas aussi naturels …

54 time-series arima interpretation moving-average

9

Comment R et Python se complètent-ils en data science?

Dans de nombreux tutoriels ou manuels, le récit semble impliquer que R et python coexistent en tant que composants complémentaires du processus d'analyse. À mes yeux, cependant, il semble que les deux langues fassent en quelque sorte la même chose. Ma question est donc de savoir s’il existe des créneaux …

54 r python software

5

Exemples d’approches bayésienne et fréquentiste donnant des réponses différentes

Remarque: je suis conscient des différences philosophiques entre les statistiques bayésiennes et fréquentistes. Par exemple, "quelle est la probabilité que la pièce de monnaie sur la table soit une tête" n'a pas de sens dans les statistiques fréquentistes, puisqu'elle a déjà atterri têtes ou têtes - il n'y a rien …

54 bayesian frequentist