Statistiques et Big Data

3

Comment calculer la valeur de p des paramètres pour le modèle ARIMA dans R?

Lors de la recherche de séries chronologiques dans R, j'ai trouvé que arima seules les valeurs de coefficient et leurs erreurs standard du modèle ajusté étaient fournies. Cependant, je veux également obtenir la valeur de p des coefficients. Je n'ai trouvé aucune fonction qui donne la signification de coef. Je …

23 r time-series chi-squared arima parametric

4

Code R pour la prévision de séries chronologiques à l'aide du filtre de Kalman

Quelqu'un a-t-il un bon exemple de prévision / lissage de séries chronologiques à l'aide du filtre de Kalman dans R?

23 r time-series kalman-filter

5

Des alternatives aux arbres de classification, avec de meilleures performances prédictives (ex: CV)?

Je recherche une alternative aux arbres de classification qui pourrait donner un meilleur pouvoir prédictif. Les données dont je traite ont des facteurs à la fois pour les variables explicatives et expliquées. Je me souviens avoir rencontré des forêts aléatoires et des réseaux de neurones dans ce contexte, bien que …

23 r machine-learning classification cart

2

Quelle est la différence entre l'ACP et l'ACP asymptotique?

Dans deux articles en 1986 et 1988 , Connor et Korajczyk ont proposé une approche pour modéliser les rendements des actifs. Étant donné que ces séries chronologiques ont généralement plus d'actifs que les observations de période, ils ont proposé d'effectuer une ACP sur les covariances transversales des rendements des actifs. …

23 pca econometrics

2

Modèles de statistiques spatiales: CAR vs SAR

Quand préférerait-on utiliser un modèle autorégressif conditionnel plutôt qu'un modèle autorégressif simultané lors de la modélisation de données aériennes géoréférencées autocorrélées?

23 modeling spatial

2

Forensics statistiques: Benford et au-delà

Quelles méthodes générales existe-t-il pour détecter la fraude, les anomalies, les falsifications, etc. dans les travaux scientifiques produits par un tiers? (J'étais motivé à le demander par la récente affaire Marc Hauser .) Habituellement, pour les fraudes électorales et comptables, une variante de la loi de Benford est citée. Je …

23 meta-analysis fraud

2

Variables de clustering basées sur les corrélations entre elles

Des questions: J'ai une grande matrice de corrélation. Au lieu de regrouper les corrélations individuelles, je veux regrouper les variables en fonction de leurs corrélations l'une avec l'autre, c'est-à-dire si la variable A et la variable B ont des corrélations similaires aux variables C à Z, alors A et B …

23 correlation clustering correlation-matrix

9

Séries chronologiques pour les données de dénombrement, avec dénombrements <20

J'ai récemment commencé à travailler pour une clinique antituberculeuse. Nous nous réunissons périodiquement pour discuter du nombre de cas de tuberculose que nous traitons actuellement, du nombre de tests administrés, etc. J'aimerais commencer à modéliser ces chiffres afin de ne pas simplement deviner si quelque chose est inhabituel ou non. …

23 r time-series poisson-distribution count-data epidemiology

5

Quel est le problème avec cet algorithme de mélange «naïf»?

Il s'agit d'une suite à une question de Stackoverflow sur le mélange aléatoire d'un tableau . Il existe des algorithmes établis (tels que le shuffle de Knuth-Fisher-Yates ) que l'on devrait utiliser pour mélanger un tableau, plutôt que de s'appuyer sur des implémentations ad hoc "naïves". Je veux maintenant prouver …

23 combinatorics randomness

1

Explication de min_child_weight dans l'algorithme xgboost

La définition du paramètre min_child_weight dans xgboost est donnée comme: somme minimale du poids d'instance (toile de jute) nécessaire chez un enfant. Si l'étape de partition d'arborescence aboutit à un nœud feuille avec la somme du poids d'instance inférieure à min_child_weight, le processus de construction abandonnera le partitionnement. En mode …

23 machine-learning xgboost hessian

1

Quels sont exactement les mécanismes d'attention?

Les mécanismes d'attention ont été utilisés dans divers articles sur le Deep Learning au cours des dernières années. Ilya Sutskever, responsable de la recherche chez Open AI, les a félicités avec enthousiasme: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Eugenio Culurciello de l'Université Purdue a déclaré que les RNN et les LSTM devraient être abandonnés au …

23 time-series deep-learning lstm rnn attention

1

Monte Carlo hamiltonien contre Monte Carlo séquentiel

J'essaie d'avoir une idée des avantages et des inconvénients relatifs, ainsi que des différents domaines d'application de ces deux schémas MCMC. Quand utiliseriez-vous lequel et pourquoi? Quand l'un pourrait-il échouer mais pas l'autre (par exemple, où la console HMC est-elle applicable mais pas SMC, et vice versa) Peut-on, très naïvement …

23 mcmc random-walk particle-filter probabilistic-programming hmc

2

Pourquoi existe-t-il deux formules / notations de pertes logistiques différentes?

J'ai vu deux types de formulations de pertes logistiques. On peut facilement montrer qu'ils sont identiques, la seule différence est la définition de l'étiquette yyy . Formulation / notation 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) où p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)} , où la fonction logistique mappe un nombre réelβTxβTx\beta^T …

23 logistic generalized-linear-model notation loss-functions

3

Un élevé est-il jamais inutile?

Cette question a été migrée depuis Stack Overflow car il est possible d'y répondre lors de la validation croisée. Migré il y a 4 ans . Dans les statistiques, nous faisons des régressions linéaires, leurs tout débuts. En général, nous savons que plus le élevé , mieux c'est, mais existe-t-il …

23 regression r-squared

2

Pourquoi Laplace produit-elle avant des solutions éparses?

Je regardais à travers la littérature sur la régularisation, et je vois souvent des paragraphes qui relient la régulation de L2 à Gaussian prior, et L1 à Laplace centrée sur zéro. Je sais à quoi ressemblent ces priors, mais je ne comprends pas comment cela se traduit, par exemple, par …

23 regression bayesian prior regularization laplace-distribution