Q & A pour les personnes intéressées par les statistiques, l'apprentissage automatique, l'analyse de données, l'exploration de données et la visualisation de données
Disons que j'ai deux échantillons. Si je veux savoir s'ils sont issus de différentes populations, je peux effectuer un test t. Mais disons que je veux tester si les échantillons proviennent de la même population. Comment est-que quelqu'un peut faire ça? Autrement dit, comment puis-je calculer la probabilité statistique que …
Quelle est la différence entre le réseau neuronal , le réseau bayésien , l' arbre de décision et les réseaux de Petri , même s'ils sont tous des modèles graphiques et décrivent visuellement la relation de cause à effet.
J'ai essayé de comprendre comment le taux de fausses découvertes (FDR) devrait éclairer les conclusions de chaque chercheur. Par exemple, si votre étude manque de puissance, devriez-vous actualiser vos résultats même s'ils sont significatifs à α=.05α=.05\alpha = .05 ? Remarque: je parle du FDR dans le contexte de l'examen des …
Quand on amorce un paramètre pour obtenir l'erreur standard, nous obtenons une distribution du paramètre. Pourquoi n'utilisons-nous pas la moyenne de cette distribution comme résultat ou estimation pour le paramètre que nous essayons d'obtenir? La distribution ne devrait-elle pas se rapprocher de la vraie? Par conséquent, nous obtiendrions une bonne …
Je suis en train d'interpréter les facteurs de la variance de l' inflation à l' aide de la viffonction dans le package R car. La fonction imprime à la fois un généralisé et également . Selon le fichier d'aide , cette dernière valeurVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Pour ajuster la dimension de l'ellipsoïde de …
Pour le LASSO (et d'autres procédures de sélection de modèle), il est crucial de redimensionner les prédicteurs. La recommandation générale que je suis consiste simplement à utiliser une normalisation de 0 moyenne, 1 écart-type pour les variables continues. Mais que faire avec les nuls? Par exemple, certains exemples appliqués de …
Disons que j'ai une distribution gaussienne multivariée à dimensions. Je suppose observations (chacun d'eux un -vector) à partir de cette distribution et calculer la matrice de covariance d'échantillon . Dans cet article , les auteurs déclarent que la matrice de covariance de l'échantillon calculée avec est singulière.n p S p …
Dans le cas de régression linéaire simple , vous pouvez dériver l'estimateur des moindres carrés sorte que vous n'avez pas besoin de connaître pour estimery=β0+β1xy=β0+β1xy=\beta_0+\beta_1xβ^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 Supposons que j'ai , comment puis-je dériver sans estimer ? ou n'est-ce pas possible?y=β1x1+β2x2y=β1x1+β2x2y=\beta_1x_1+\beta_2x_2β^1β^1\hat\beta_1β^2β^2\hat\beta_2
J'avais une question sur le paramètre de profondeur d'interaction en gbm dans R. Cela peut être une question noob, pour laquelle je m'excuse, mais comment le paramètre, qui je crois dénote le nombre de nœuds terminaux dans un arbre, indique fondamentalement X-way interaction entre les prédicteurs? J'essaie juste de comprendre …
Notre petite équipe a eu une discussion et est restée coincée. Quelqu'un sait-il si la régression de Cox a une distribution de Poisson sous-jacente? Nous avons eu un débat sur le fait que la régression de Cox avec un temps de risque constant pourrait avoir des similitudes avec la régression …
J'ai un ensemble de données avec un grand nombre de réponses Oui / Non. Puis- je utiliser les composants principaux (ACP) ou toute autre analyse de réduction des données (comme l'analyse factorielle) pour ce type de données? Veuillez indiquer comment je procède à l'aide de SPSS.
Je suis un peu confus avec la façon dont le SVD est utilisé dans le filtrage collaboratif. Supposons que j'ai un graphique social et que je construise une matrice d'adjacence à partir des bords, puis je prends un SVD (oublions la régularisation, les taux d'apprentissage, les optimisations de rareté, etc.), …
J'ai essayé de lire sur différentes sources, mais je ne sais toujours pas quel test serait le plus approprié dans mon cas. Il y a trois questions différentes que je pose à propos de mon jeu de données: Les sujets sont testés pour des infections de X à différents moments. …
Je lisais l'article ImageNet Classification with Deep Convolutional Neural Networks et dans la section 3, ils expliquaient l'architecture de leur Convolutional Neural Network, ils expliquaient comment ils préféraient utiliser: non linéarité non saturanteF( x ) = m a x ( 0 , x ) .F(X)=muneX(0,X).f(x) = max(0, x). car il …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.