Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Je veux savoir quelles sont les différences entre l' algorithme avant-arrière et l' algorithme de Viterbi pour l'inférence dans les modèles de Markov cachés (HMM).
J'ai compris que Random Forest et Extremely Randomized Trees diffèrent en ce sens que les divisions des arbres de Random Forest sont déterministes, alors qu'elles sont aléatoires dans le cas d'arbres extrêmement aléatoires (pour être plus précis, la division suivante est la meilleure parmi les divisions uniformes aléatoires dans les …
J'ai remarqué qu'il existe quelques implémentations de forêt aléatoire telles que ALGLIB, Waffles et certains packages R tels que randomForest. Quelqu'un peut-il me dire si ces bibliothèques sont hautement optimisées? Sont-ils fondamentalement équivalents aux forêts aléatoires décrites dans Les éléments de l’apprentissage statistique ou ont-ils été complétés de nombreuses astuces? …
Quelqu'un peut-il expliquer comment les propriétés des journaux permettent de réaliser des régressions linéaires dans lesquelles les coefficients sont interprétés comme des pourcentages de variation?
Je veux apprendre les réseaux de neurones. Je suis un linguiste informatisé. Je connais des méthodes d’apprentissage statistique et peut coder en Python. Je cherche à commencer avec ses concepts et à connaître un ou deux modèles populaires qui pourraient être utiles du point de vue de la linguistique computationnelle. …
J'ai un hachage SHA256 de 64 caractères. J'espère former un modèle capable de prédire si le texte en clair utilisé pour générer le hachage commence par un 1 ou non. Peu importe si cela est "possible", quel algorithme serait la meilleure approche? Mes premières pensées Générez un grand échantillon de …
Mon stat prof dit, en gros, si l’un des trois suivants est donné, vous pouvez trouver les deux autres: Fonction de distribution cumulative Fonction de génération de moment Fonction de densité de probabilité Mais mon professeur d'économétrie a déclaré que les CDF sont plus fondamentaux que les PDF car il …
J'essaie d'ajouter une couche softmax à un réseau de neurones formé à la rétropropagation, alors j'essaie de calculer son gradient. La sortie softmax est hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}} oùjjjest le nombre de neurones de sortie. Si je le dérive alors je reçois ∂hj∂zj=hj(1−hj)∂hj∂zj=hj(1−hj)\frac{\partial{h_j}}{\partial{z_j}}=h_j(1-h_j) Similaire à la régression logistique. Cependant, cela est …
Je comprends que la définition de base de l'endogénéité est que n'est pas satisfait, mais qu'est-ce que cela signifie dans le sens du monde réel? J'ai lu l'article de Wikipedia, avec l'exemple de l'offre et de la demande, pour essayer de le comprendre, mais cela n'a pas vraiment aidé. J'ai …
Comme je suis un peu nouveau dans la forêt aléatoire, je suis toujours aux prises avec certains concepts de base. En régression linéaire, on suppose des observations indépendantes, une variance constante… Quelles sont les hypothèses de base que nous faisons lorsque nous utilisons une forêt aléatoire? Quelles sont les principales …
Je considère le problème de la classification (multiclass) basée sur des séries temporelles de longueur variable TTT , c’est-à-dire que l’on cherche une fonction f(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(XT)=y∈[1..K]for XT=(x1,…,xT)with xt∈Rd ,f(X_T) = y \in [1..K]\\ \text{for } X_T = (x_1, \dots, x_T)\\ \text{with } x_t \in \mathbb{R}^d ~, parintermédiaireune représentation …
Je me demande si quelqu'un est au courant d'un recueil de techniques de validation croisée avec une discussion des différences entre elles et un guide sur le moment d'utiliser chacune d'elles. Wikipedia a une liste des techniques les plus courantes, mais je suis curieux de savoir s'il existe d'autres techniques …
Je cherche un moyen de générer des nombres aléatoires qui semblent distribués de manière uniforme - et chaque test montrera qu'ils sont uniformes - sauf qu'ils sont distribués de manière plus uniforme que les données véritablement uniformes . Le problème que j'ai avec les "vrais" aléas uniformes, c'est qu'ils vont …
Lorsqu'ils enseignent une classe d'initiation, les enseignants que je connais ont tendance à inventer des chiffres et une histoire pour illustrer la méthode qu'ils enseignent. Ce que je préférerais, c'est raconter une histoire vraie avec des chiffres réels. Cependant, ces récits doivent se rapporter à un très petit ensemble de …
Pour certains d'entre nous, l'arbitrage des documents fait partie du travail. Lors de l’arbitrage de documents de méthodologie statistique, je pense que des conseils provenant d’autres domaines sont plutôt utiles, à savoir l’ informatique et les mathématiques . Cette question concerne l'examen d'un plus grand nombre d'articles statistiques appliqués. J'entends …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.