Questions marquées «sampling»

Création d'échantillons à partir d'une population bien spécifiée à l'aide d'une méthode probabiliste et / ou production de nombres aléatoires à partir d'une distribution spécifiée. Cette balise étant ambiguë, veuillez considérer [enquête-échantillonnage] pour les premiers et [monte-carlo] ou [simulation] pour les seconds. Pour toute question concernant la création d'échantillons aléatoires à partir de distributions connues, veuillez envisager d'utiliser la balise [random-generation].

2
Taille des échantillons bootstrap
J'apprends le bootstrap comme moyen d'estimer la variance d'un échantillon statistique. J'ai un doute fondamental. Citant de http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Combien d'observations devons-nous rééchantillonner? Une bonne suggestion est la taille de l'échantillon d'origine. Comment rééchantillonner autant d'observations que dans l'échantillon d'origine? Si j'ai un échantillon de 100 et que j'essaie …


2
L'échantillonnage basé sur la chaîne de Markov est-il le «meilleur» pour l'échantillonnage de Monte Carlo? Existe-t-il des régimes alternatifs?
Markov Chain Monte Carlo est une méthode basée sur les chaînes de Markov qui nous permet d'obtenir des échantillons (dans un cadre Monte Carlo) à partir de distributions non standard à partir desquelles nous ne pouvons pas prélever directement des échantillons. Ma question est de savoir pourquoi la chaîne de …

2
Échantillonnage CDF inverse pour une distribution mixte
La version courte hors contexte Soit une variable aléatoire avec CDF yyyF(⋅)≡{θθ+(1−θ)×CDFlog-normal(⋅;μ,σ) y = 0 y > 0F(⋅)≡{θ y = 0 θ+(1−θ)×CDFlog-normal(⋅;μ,σ) y > 0 F(\cdot) \equiv \cases{\theta & y = 0 \\ \theta + (1-\theta) \times \text{CDF}_{\text{log-normal}}(\cdot; \mu, \sigma) & y > 0} Disons que je voulais simuler des …


4
(en interaction) MCMC pour multimodal postérieur
J'essaie d'échantillonner à partir d'un postérieur ayant de nombreux modes particulièrement éloignés les uns des autres en utilisant MCMC. Il semble que dans la plupart des cas, un seul de ces modes contient le 95% hpd que je recherche. J'ai essayé d'implémenter des solutions basées sur la simulation tempérée mais …


1
Comment comparer les événements observés aux événements attendus?
Supposons que j'ai un échantillon de fréquences de 4 événements possibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 et j'ai les probabilités attendues que mes événements se produisent: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Avec la somme des fréquences …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

4
Peut-on laisser de côté les données de la recherche car elles ne sont pas significatives?
J'ai rencontré cette phrase en lisant un article sur sciencemag.org . Au final, les réponses de seulement 7600 chercheurs dans 12 pays ont été incluses car les données restantes n'étaient pas considérées comme statistiquement significatives. Est-ce une bonne façon de faire de la recherche? Oublier les résultats parce qu'ils n'étaient …

3
Comment puis-je simuler des microdonnées de recensement pour de petites régions en utilisant un échantillon de microdonnées de 1% à grande échelle et des statistiques agrégées à petite échelle?
Je voudrais effectuer une analyse multivariée au niveau individuel à de petits niveaux d'agrégation géographique (districts de collecte du recensement australien). De toute évidence, le recensement n'est pas disponible à ces petits niveaux d'agrégation pour des raisons de confidentialité, donc j'examine d'autres alternatives. Presque toutes les variables d'intérêt sont catégoriques. …





3
Comment rééchantillonner une série temporelle XTS dans R?
J'ai une XTSsérie chronologique irrégulièrement espacée (avec des POSIXctvaleurs comme type d'index). Comment puis-je créer une nouvelle série temporelle échantillonnée à un intervalle de 10 minutes, par exemple, mais avec chaque instant d'échantillonnage aligné sur une heure ronde (13:00:00, 13:10:00, 13:20:00, ...) . Si un moment de rééchantillonnage ne tombe …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.