Questions marquées «confidence-interval»

Un intervalle de confiance est un intervalle qui couvre un paramètre inconnu avec (1α)%confiance. Les intervalles de confiance sont un concept fréquentiste. Ils sont souvent confondus avec des intervalles crédibles qui est l'analogue bayésien.


1
Intervalle de confiance pour les prévisions xgb
experts! Peut-être, vous savez comment calculer l'intervalle de confiance pour xgboost? La formule classique avec t-distribution ne peut pas aider, car mes données ne sont pas normalement distribuées. Ou n'a pas d'importance? Si vous proposez de la littérature, ce sera très utile, mais les approches en R et Python (dans …

2
Modèle étrange dans l'estimation de l'intervalle de confiance de l'écart-type via le bootstrap
Je voulais estimer l'intervalle de confiance pour l'écart-type de certaines données. Le code R ressemble à ceci: library(boot) sd_boot <- function (x, ind) { res <- sd(x$ReadyChange[ind], na.rm = TRUE) return(res) } data_boot <- boot::boot(data, statistic = sd_boot, R = 10000) plot(data_boot) Et j'ai l'intrigue suivante: Je suis coincé avec …



1
La transformation monotone inversible d'un intervalle de confiance vous donne-t-elle un intervalle de confiance (au même niveau) dans l'espace transformé?
Supposer (a,b)(a,b) (a,b) est un intervalle de confiance de niveau pour un paramètre . Supposons que est une transformation inversible monotone. Alors c'est(1−α)(1−α)(1-\alpha)θθ\thetaηη\eta (η(a),η(b))(η(a),η(b)) \left (\eta(a), \eta(b) \right ) un intervalle de confiance de niveau pour ? Supposons que le paramètre et les points de terminaison de l'intervalle de confiance …

1
Intervalles de confiance pour ECDF
L'inégalité Dvoretzky – Kiefer – Wolfowitz est la suivante: Pr ( sup |F^n( x ) - F( x ) | > ϵ ) ≤ 2 exp( - 2 nϵ2)Pr(sup|F^n(x)−F(x)|>ϵ)≤2exp⁡(−2nϵ2)Pr(\text{sup}|\hat{F}_n(x)-F(x)|>\epsilon)\leq 2\exp(-2n\epsilon^2) , et il prédit à quel point une fonction de distribution déterminée empiriquement sera proche de la fonction de distribution …


1
Les effets de groupe dans un modèle à effets mixtes sont-ils supposés avoir été choisis dans une distribution normale?
Imaginons que nous nous intéressions à la façon dont les notes des étudiants sont affectées par le nombre d'heures que ces étudiants étudient. Nous échantillonnons des étudiants de plusieurs écoles différentes. Nous exécutons le modèle d'effets mixtes suivant: exam.gradesje= a +β1×heures.étudiéje+écolej+ejeexam.gradesje=une+β1×heures.étudiéje+écolej+eje \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + \text{school}_j …

1
Pourquoi voudrais-je bootstrap lors du calcul d'un échantillon t-test indépendant? (comment justifier, interpréter et signaler un test t amorcé)
Disons que j'ai deux conditions, et ma taille d'échantillon pour les deux conditions est extrêmement faible. Disons que je n'ai que 14 observations dans la première condition et 11 dans l'autre. Je veux utiliser le test t pour tester si les différences moyennes sont significativement différentes les unes des autres. …


5
Intervalle de confiance sur une quantité aléatoire?
Supposons que est un vecteur inconnu et que l'on observe . Je voudrais calculer des intervalles de confiance sur la quantité aléatoire , basée uniquement sur le observé et le paramètre connu . Autrement dit, pour un , trouver tel que .a⃗ a→\vec{a}pppb⃗ ∼N(a⃗ ,I)b→∼N(a→,I)\vec{b} \sim \mathcal{N}\left(\vec{a}, I\right)b⃗ ⊤a⃗ b→⊤a→\vec{b}^{\top} …


2
Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?
Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle se monthly spendtrouve la variable …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.