Questions marquées «bootstrap»

Le bootstrap est une méthode de rééchantillonnage pour estimer la distribution d'échantillonnage d'une statistique.


1
Quelle est l'intuition derrière les échantillons échangeables sous l'hypothèse nulle?
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test non paramétrique comme Mann-Whitney-U-testcela entraînerait la perte …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 



2
Pourquoi la fonction d'amorçage scikit-learn rééchantillonne-t-elle l'ensemble de test?
Lors de l'utilisation du bootstrap pour l'évaluation de modèles, j'ai toujours pensé que les échantillons hors sac étaient directement utilisés comme ensemble de test. Cependant, cela ne semble pas être le cas pour l' approche obsolète de scikit-learnBootstrap , qui semble construire l'ensemble de test à partir d'un dessin avec …


3
Bootstrap: la question du sur-ajustement
Supposons que l'on effectue le bootstrap dit non paramétrique en tirant échantillons de taille n chacun à partir des n observations originales avec remplacement. Je crois que cette procédure équivaut à estimer la fonction de distribution cumulative par le cdf empirique:BBBnnnnnn http://en.wikipedia.org/wiki/Empirical_distribution_function puis obtenir les échantillons de bootstrap en simulant …

3
Questions sur le bootstrap paramétrique et non paramétrique
Je lis le chapitre sur les statistiques fréquentes du livre de Kevin Murphy " Machine Learning - A Probabilistic Perspective ". La section sur le bootstrap se lit comme suit: Le bootstrap est une technique Monte Carlo simple pour approximer la distribution d'échantillonnage. Ceci est particulièrement utile dans les cas …


1
Cette méthode de rééchantillonnage des séries chronologiques est-elle connue dans la littérature? At-il un nom?
Je cherchais récemment des moyens de rééchantillonner des séries chronologiques, Préserve approximativement l'auto-corrélation des longs processus de mémoire. Préserver le domaine des observations (par exemple une série temporelle rééchantillonnée d'entiers est toujours une série temporelle d'entiers). Peut affecter certaines échelles uniquement, si nécessaire. J'ai trouvé le schéma de permutation suivant …

4
Intervalles de prédiction pour les algorithmes d'apprentissage automatique
Je veux savoir si le processus décrit ci-dessous est valide / acceptable et toute justification disponible. L'idée: les algorithmes d'apprentissage supervisé ne supposent pas de structures / distributions sous-jacentes sur les données. À la fin de la journée, ils produisent des estimations ponctuelles. J'espère quantifier en quelque sorte l'incertitude des …

1
Pourquoi l'erreur «l'ajustement estimé« a »est NA» est-elle générée à partir du package de démarrage R lors du calcul des intervalles de confiance à l'aide de la méthode bca?
J'ai un vecteur de nombres que j'ai téléchargé ici (... / code / MyData.Rdata) en utilisant dput. Je voudrais obtenir le bca ci donc j'ai écrit ce code: my.mean <- function(dat, idx){ return (mean(dat[idx], na.rm = TRUE)) } boot.out<-boot(data=my.data, statistic = my.mean, R=1000) Mais quand je lance ce qui suit, …
14 r  bootstrap 


1
Pourquoi utiliser le bootstrap paramétrique?
J'essaie actuellement de comprendre certaines choses concernant le bootstrap paramétrique. La plupart des choses sont probablement insignifiantes, mais je pense toujours avoir raté quelque chose. Supposons que je souhaite obtenir des intervalles de confiance pour les données à l'aide d'une procédure d'amorçage paramétrique. J'ai donc cet échantillon et je suppose …

1
Les erreurs standard d'amorçage et les intervalles de confiance sont-ils appropriés dans les régressions où l'hypothèse d'homoscédasticité est violée?
Si, dans les régressions OLS standard, deux hypothèses sont violées (distribution normale des erreurs, homoscédasticité), l'amorçage des erreurs standard et des intervalles de confiance est-il une alternative appropriée pour obtenir des résultats significatifs en ce qui concerne la signification des coefficients du régresseur? Les tests de signification avec des erreurs …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.