Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Supposons que nous ayons une variable aléatoire . Si était le vrai paramètre, la fonction de vraisemblance devrait être maximisée et la dérivée égale à zéro. C'est le principe de base de l'estimateur du maximum de vraisemblance.X∼f(x|θ)X∼f(x|θ)X \sim f(x|\theta)θ0θ0\theta_0 Si je comprends bien, les informations Fisher sont définies comme I(θ)=E[(∂∂θf(X|θ))2]I(θ)=E[(∂∂θf(X|θ))2]I(\theta) …
Pourquoi les nœuds de polarisation sont-ils utilisés dans les réseaux de neurones? Combien devez-vous utiliser? Dans quels calques devez-vous les utiliser: tous les calques masqués et le calque de sortie?
Les introductions aux modèles graphiques les décrivent comme "... un mariage entre la théorie des graphes et la théorie des probabilités". J'obtiens la partie théorie des probabilités mais j'ai du mal à comprendre où exactement la théorie des graphes s'inscrit. Je recherche des exemples concrets, au-delà de l'utilisation évidente de …
D'une part, j'ai la régression à la moyenne et d'autre part j'ai l' erreur du joueur . Le sophisme de Gambler est défini par Miller et Sanjurjo (2019) comme «la croyance erronée que les séquences aléatoires ont une tendance systématique au renversement, c'est-à-dire que les séquences de résultats similaires sont …
Contexte Supposons que nous ayons un modèle des moindres carrés ordinaires où nous avons coefficients dans notre modèle de régression, kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} où est un vecteur de coefficients, est la matrice de conception définie parββ\mathbf{\beta}(k×1)(k×1)(k\times1)XX\mathbf{X} X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 …
Tout en dérivant formellement l'intervalle de confiance d'une estimation, je me suis retrouvé avec une formule qui ressemble de très près à la façon dont la valeur de est calculée.ppp D'où la question: sont-ils formellement équivalents? Ie rejette une hypothèse avec une valeur critique équivalente à n'appartenant pas à l'intervalle …
Ayant récemment étudié le bootstrap, j'ai posé une question conceptuelle qui me laisse toujours perplexe: Vous avez une population et vous voulez connaître un attribut de population, c'est-à-dire θ=g(P)θ=g(P)\theta=g(P) , où j'utilise PPP pour représenter la population. Ce θθ\theta pourrait être la moyenne de la population par exemple. Habituellement, vous …
Est-il possible pour l' ANOVA unidirectionnelle (avec groupes ou "niveaux") de signaler une différence significative lorsqu'aucun des tests t par paire ne le fait?N> 2N>2N>2N(N−1)/2N(N-1)/2N(N-1)/2 Dans cette réponse, @whuber a écrit: Il est bien connu qu'un test ANOVA F global peut détecter une différence de moyennes même dans les cas …
J'ai une distribution observée expérimentalement qui ressemble beaucoup à une distribution gamma ou lognormale. J'ai lu que la distribution lognormale est la distribution de probabilité d'entropie maximale pour une variable aléatoire pour laquelle la moyenne et la variance de ln ( X ) sont fixes. La distribution gamma a-t-elle des …
Lorsque vous prédisez une valeur ajustée à partir d'un modèle de régression logistique, comment les erreurs standard sont-elles calculées? Je veux dire pour les valeurs ajustées , pas pour les coefficients (ce qui implique la matrice d'information des pêcheurs). J'ai seulement découvert comment obtenir les chiffres avec R(par exemple, ici …
Je voulais faire une démonstration de classe où je compare un intervalle t à un intervalle de bootstrap et calcule la probabilité de couverture des deux. Je voulais que les données proviennent d'une distribution asymétrique, j'ai donc choisi de générer les données sous la forme d' exp(rnorm(10, 0, 2)) + …
Je voudrais utiliser GLM et Elastic Net pour sélectionner ces fonctionnalités pertinentes + construire un modèle de régression linéaire (c'est-à-dire à la fois la prédiction et la compréhension, il serait donc préférable de se retrouver avec relativement peu de paramètres). La sortie est continue. C'est gènes pour 50 cas. J'ai …
Je suis un peu déroutant à propos de la zone sous courbe (AUC) de ROC et de la précision globale. L'AUC sera-t-elle proportionnelle à la précision globale? En d'autres termes, lorsque nous aurons une plus grande précision globale, aurons-nous définitivement une ASC plus grande? Ou sont-ils par définition positivement corrélés? …
Je suis un peu confus avec la différence entre un SVM et un perceptron. Permettez-moi d'essayer de résumer ma compréhension ici, et n'hésitez pas à corriger où je me trompe et à compléter ce que j'ai manqué. Le Perceptron n'essaie pas d'optimiser la "distance" de séparation. Tant qu'il trouve un …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.