Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
J'ai lu le lemme de Neyman – Pearson dans le livre Introduction to the Theory of Statistics de Mood, Graybill et Boes. Mais je n'ai pas compris le lemme. Quelqu'un peut-il m'expliquer le lemme en termes clairs? Que dit-il? Lemme de Neyman-Pearson: Soit X1,…,XnX1,…,XnX_1,\ldots,X_n un échantillon aléatoire de f(x;θ)f(x;θ)f(x;\theta) , …
Essentiellement, ma question est que dans les Perceptrons multicouches, les perceptrons sont utilisés avec une fonction d'activation sigmoïde. Alors que dans la règle de mise à jour y est calculée comme suity^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} En quoi ce Perceptron "sigmoïde" diffère-t-il alors d'une régression logistique? Je dis qu'un perceptron sigmoïde …
Je suis tombé sur une remarque sur The Chemical Statistician selon laquelle une médiane d'échantillon pourrait souvent être un choix pour une statistique suffisante mais, outre le cas évident d'une ou deux observations où elle est égale à la moyenne de l'échantillon, je ne peux pas penser à une autre …
Je voudrais savoir s'il existe un code pour former un réseau neuronal convolutionnel à la classification des séries chronologiques. J'ai vu des articles récents ( http://www.fer.unizg.hr/_download/repository/KDI-Djalto.pdf ) mais je ne sais pas s'il existe quelque chose ou si je dois le coder moi-même.
Quelle est la différence entre la régression logistique et la régression logit? Je comprends qu'ils sont similaires (ou même la même chose), mais quelqu'un pourrait-il expliquer la différence (s) entre ces deux? Est-ce une question de chance?
Je veux voir si je suis sur la bonne voie en analysant mes parcelles ACF et PACF: Contexte: (Reff: Philip Hans Franses, 1998) Comme ACF et PACF affichent des valeurs significatives, je suppose qu'un modèle ARMA répondra à mes besoins L'ACF peut être utilisé pour estimer la partie MA, c'est-à-dire …
J'ai un ensemble de données avec trois variables catégorielles et je veux visualiser la relation entre les trois dans un graphique. Des idées? Actuellement, j'utilise les trois graphiques suivants: Chaque graphique correspond à un niveau de dépression de base (léger, modéré, sévère). Ensuite, dans chaque graphique, j'examine la relation entre …
Quelles sont les méthodes utilisées par les algorithmes d'apprentissage de l'arbre de décision pour gérer les valeurs manquantes. Remplissent-ils simplement l'emplacement en utilisant une valeur appelée manquante? Merci.
Cette question a été migrée à partir de Stack Overflow car il est possible d'y répondre sur la validation croisée. Migré il y a 5 ans . J'ai une question concernant l'interprétation des paramètres d'un GLM avec une variable dépendante distribuée gamma. Voici ce que R renvoie pour mon GLM …
Dans un petit ensemble de données ( ) avec lequel je travaille, plusieurs variables me donnent une prédiction / séparation parfaite . J'utilise donc la régression logistique de Firth pour traiter le problème.n∼100n∼100n\sim100 Si je sélectionne le meilleur modèle par AIC ou BIC , dois-je inclure le terme de pénalité …
Je comprends que si un processus dépend de valeurs antérieures de lui-même, alors c'est un processus AR. Si cela dépend d'erreurs précédentes, c'est un processus MA. Quand se produirait l'une de ces deux situations? Quelqu'un a-t-il un exemple solide qui éclaire le problème sous-jacent concernant ce que signifie qu'un processus …
J'ai une expérience à mesures répétées où la variable dépendante est un pourcentage et j'ai plusieurs facteurs comme variables indépendantes. Je voudrais utiliser à glmerpartir du package R lme4pour le traiter comme un problème de régression logistique (en spécifiant family=binomial) car il semble s'adapter directement à cette configuration. Mes données …
J'étudie les arbres de classification et de régression, et l'une des mesures pour l'emplacement divisé est le score GINI. Maintenant, je suis habitué à déterminer le meilleur emplacement divisé lorsque le log du rapport de vraisemblance des mêmes données entre deux distributions est nul, ce qui signifie que la probabilité …
Quelqu'un peut-il fournir une liste claire des différences entre la régression log-linéaire et la régression logistique? Je comprends que le premier est un modèle de régression linéaire simple, mais je ne sais pas quand chacun doit être utilisé.
Pour un modèle linéaire , le terme de retrait est toujours .y=β0+xβ+εy=β0+Xβ+εy=\beta_0+x\beta+\varepsilonP(β)P(β)P(\beta) Quelle est la raison pour laquelle nous ne rétrécissons pas le terme de biais (interception) ? Faut-il réduire le terme de biais dans les modèles de réseaux de neurones?β0β0\beta_0
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.