Un intervalle de confiance est un intervalle qui couvre un paramètre inconnu avec ( 1 - α ) %confiance. Les intervalles de confiance sont un concept fréquentiste. Ils sont souvent confondus avec des intervalles crédibles qui est l'analogue bayésien.
C'est un problème de la "7e Olympiade des étudiants de Kolmogorov en théorie des probabilités": Étant donné une observation d'une distribution avec les deux paramètres inconnus, donner un intervalle de confiance pour avec un niveau de confiance d'au moins 99%.Normal ( μ , σ 2 ) σ 2XXXOrdinaire( μ , …
Dans mon cours de statistique élémentaire, j'ai appris à construire un intervalle de confiance à 95% tel que la moyenne de la population, , basé sur la normalité asymptotique pour les "grands" échantillons. Outre les méthodes de rééchantillonnage (comme le bootstrap), il existe une autre approche basée sur la «vraisemblance …
Dans l'inférence statistique , le problème 9.6b, une "région de plus haute densité (HDR)" est mentionné. Cependant, je n'ai pas trouvé la définition de ce terme dans le livre. Un terme similaire est la plus haute densité postérieure (HPD). Mais cela ne rentre pas dans ce contexte, car 9.6b ne …
Supposons que je suis consultant et que je souhaite expliquer à mon client l'utilité de l'intervalle de confiance. Le client me dit que mes intervalles sont trop larges pour être utiles et il préférerait en utiliser des moitié moins larges. Comment dois-je répondre?
Pour illustrer ma question, supposons que j'ai un ensemble de formation où l'entrée a un degré de bruit mais pas la sortie, par exemple; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : …
Supposons que j'essaie d'estimer un grand nombre de paramètres à partir de données de grande dimension, en utilisant une sorte d'estimations régularisées. Le régularisateur introduit un certain biais dans les estimations, mais il peut toujours être un bon compromis car la réduction de la variance devrait plus que compenser. Le …
SPSS fournit la sortie «intervalle de confiance des moyennes de différence». J'ai lu à certains endroits que cela signifie "95 fois sur 100, notre différence moyenne d'échantillon sera entre entre ces limites" Je trouve cela peu clair. Quelqu'un peut-il suggérer une formulation plus claire pour expliquer «l'intervalle de confiance de …
J'ai 383 échantillons qui ont un biais important pour certaines valeurs communes, comment calculer l'IC à 95% pour la moyenne? L'IC que j'ai calculé semble très éloigné, ce que je suppose parce que mes données ne ressemblent pas à une courbe lorsque je fais un histogramme. Je pense donc que …
Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon vecteur par la matrice de rotation PCA. Les …
J'ai pris un échantillon de points de données d'une population. Chacun de ces points a une vraie valeur (connue de la vérité terrain) et une valeur estimée. Je calcule ensuite l'erreur pour chaque point échantillonné, puis calcule le RMSE de l'échantillon.nnn Comment puis-je déduire une sorte d'intervalle de confiance autour …
J'aimerais comprendre comment générer des intervalles de prédiction pour les estimations de régression logistique. On m'a conseillé de suivre les procédures décrites dans Collett's Modeling Binary Data , 2nd Ed p.98-99. Après avoir implémenté cette procédure et l'avoir comparée aux R predict.glm, je pense en fait que ce livre montre …
J'ai deux proportions (par exemple, le taux de clics (CTR) sur un lien dans une disposition de contrôle et le CTR sur un lien dans une disposition expérimentale), et je veux calculer un intervalle de confiance de 95% autour du rapport de ces proportions. Comment puis-je faire cela? Je sais …
La logique de l'imputation multiple (MI) consiste à imputer les valeurs manquantes non pas une fois mais plusieurs (généralement M = 5), ce qui donne M ensembles de données terminés. Les M ensembles de données complétés sont ensuite analysés avec des méthodes de données complètes sur lesquelles les estimations M …
La précision est définie comme: p = true positives / (true positives + false positives) Est - il exact que, true positiveset false positivesapproche 0, la précision approche 1? Même question pour rappel: r = true positives / (true positives + false negatives) J'implémente actuellement un test statistique où j'ai …
Ok, j'ai une régression logistique et j'ai utilisé la predict()fonction pour développer une courbe de probabilité basée sur mes estimations. ## LOGIT MODEL: library(car) mod1 = glm(factor(won) ~ as.numeric(bid), data=mydat, family=binomial(link="logit")) ## PROBABILITY CURVE: all.x <- expand.grid(won=unique(won), bid=unique(bid)) y.hat.new <- predict(mod1, newdata=all.x, type="response") plot(bid<-000:1000,predict(mod1,newdata=data.frame(bid<-c(000:1000)),type="response"), lwd=5, col="blue", type="l") C'est très bien, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.