Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Lors de la recherche de séries chronologiques dans R, j'ai trouvé que arima seules les valeurs de coefficient et leurs erreurs standard du modèle ajusté étaient fournies. Cependant, je veux également obtenir la valeur de p des coefficients. Je n'ai trouvé aucune fonction qui donne la signification de coef. Je …
Je recherche une alternative aux arbres de classification qui pourrait donner un meilleur pouvoir prédictif. Les données dont je traite ont des facteurs à la fois pour les variables explicatives et expliquées. Je me souviens avoir rencontré des forêts aléatoires et des réseaux de neurones dans ce contexte, bien que …
Dans deux articles en 1986 et 1988 , Connor et Korajczyk ont proposé une approche pour modéliser les rendements des actifs. Étant donné que ces séries chronologiques ont généralement plus d'actifs que les observations de période, ils ont proposé d'effectuer une ACP sur les covariances transversales des rendements des actifs. …
Quand préférerait-on utiliser un modèle autorégressif conditionnel plutôt qu'un modèle autorégressif simultané lors de la modélisation de données aériennes géoréférencées autocorrélées?
Quelles méthodes générales existe-t-il pour détecter la fraude, les anomalies, les falsifications, etc. dans les travaux scientifiques produits par un tiers? (J'étais motivé à le demander par la récente affaire Marc Hauser .) Habituellement, pour les fraudes électorales et comptables, une variante de la loi de Benford est citée. Je …
Des questions: J'ai une grande matrice de corrélation. Au lieu de regrouper les corrélations individuelles, je veux regrouper les variables en fonction de leurs corrélations l'une avec l'autre, c'est-à-dire si la variable A et la variable B ont des corrélations similaires aux variables C à Z, alors A et B …
J'ai récemment commencé à travailler pour une clinique antituberculeuse. Nous nous réunissons périodiquement pour discuter du nombre de cas de tuberculose que nous traitons actuellement, du nombre de tests administrés, etc. J'aimerais commencer à modéliser ces chiffres afin de ne pas simplement deviner si quelque chose est inhabituel ou non. …
Il s'agit d'une suite à une question de Stackoverflow sur le mélange aléatoire d'un tableau . Il existe des algorithmes établis (tels que le shuffle de Knuth-Fisher-Yates ) que l'on devrait utiliser pour mélanger un tableau, plutôt que de s'appuyer sur des implémentations ad hoc "naïves". Je veux maintenant prouver …
La définition du paramètre min_child_weight dans xgboost est donnée comme: somme minimale du poids d'instance (toile de jute) nécessaire chez un enfant. Si l'étape de partition d'arborescence aboutit à un nœud feuille avec la somme du poids d'instance inférieure à min_child_weight, le processus de construction abandonnera le partitionnement. En mode …
Les mécanismes d'attention ont été utilisés dans divers articles sur le Deep Learning au cours des dernières années. Ilya Sutskever, responsable de la recherche chez Open AI, les a félicités avec enthousiasme: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Eugenio Culurciello de l'Université Purdue a déclaré que les RNN et les LSTM devraient être abandonnés au …
J'essaie d'avoir une idée des avantages et des inconvénients relatifs, ainsi que des différents domaines d'application de ces deux schémas MCMC. Quand utiliseriez-vous lequel et pourquoi? Quand l'un pourrait-il échouer mais pas l'autre (par exemple, où la console HMC est-elle applicable mais pas SMC, et vice versa) Peut-on, très naïvement …
J'ai vu deux types de formulations de pertes logistiques. On peut facilement montrer qu'ils sont identiques, la seule différence est la définition de l'étiquette yyy . Formulation / notation 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog(p)−(1−y)log(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) où p=11+exp(−βTx)p=11+exp(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)} , où la fonction logistique mappe un nombre réelβTxβTx\beta^T …
Cette question a été migrée depuis Stack Overflow car il est possible d'y répondre lors de la validation croisée. Migré il y a 4 ans . Dans les statistiques, nous faisons des régressions linéaires, leurs tout débuts. En général, nous savons que plus le élevé , mieux c'est, mais existe-t-il …
Je regardais à travers la littérature sur la régularisation, et je vois souvent des paragraphes qui relient la régulation de L2 à Gaussian prior, et L1 à Laplace centrée sur zéro. Je sais à quoi ressemblent ces priors, mais je ne comprends pas comment cela se traduit, par exemple, par …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.