Questions marquées «sampling»

Création d'échantillons à partir d'une population bien spécifiée à l'aide d'une méthode probabiliste et / ou production de nombres aléatoires à partir d'une distribution spécifiée. Cette balise étant ambiguë, veuillez considérer [enquête-échantillonnage] pour les premiers et [monte-carlo] ou [simulation] pour les seconds. Pour toute question concernant la création d'échantillons aléatoires à partir de distributions connues, veuillez envisager d'utiliser la balise [random-generation].


3
Effets d'échantillonnage sur les modèles de séries chronologiques
Je travaille beaucoup avec les modèles de séries temporelles financières, principalement AR (I) MA et Kalman. Un problème auquel je continue de faire face est la fréquence d'échantillonnage. Au départ, je pensais que si on m'offrait la possibilité d'échantillonner plus fréquemment à partir d'un processus sous-jacent, je devrais échantillonner aussi …



2
Les séquences à faible écart fonctionnent-elles dans des espaces discrets?
Les séquences à faible écart dans un espace réel ( ) semblent être un excellent outil pour échantillonner uniformément un espace échantillon. Pour autant que je sache, ils se généralisent bien à n'importe quel espace réel, si vous utilisez une carte appropriée (par exemple. carte linéaire).[ 0 , 1]n[0,1]n[0,1]^n[ 0 …
9 sampling 


1
Puis-je sous-échantillonner un grand ensemble de données à chaque itération MCMC?
Problème: je veux effectuer un échantillonnage de Gibbs pour en déduire une partie postérieure sur un grand ensemble de données. Malheureusement, mon modèle n'est pas très simple et donc l'échantillonnage est trop lent. J'envisagerais des approches variationnelles ou parallèles, mais avant d'aller aussi loin ... Question: Je voudrais savoir si …


3
Comment effectuer une SVD pour imputer des valeurs manquantes, un exemple concret
J'ai lu les excellents commentaires sur la façon de traiter les valeurs manquantes avant d'appliquer SVD, mais j'aimerais savoir comment cela fonctionne avec un exemple simple: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Étant donné la matrice …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 




3
Utilisation d'une distribution uniforme pour générer des échantillons aléatoires corrélés dans R
[Sur des questions récentes, je cherchais à générer des vecteurs aléatoires dans R , et je voulais partager cette "recherche" en tant que Q&A indépendante sur un point spécifique.] La génération de données aléatoires avec corrélation peut être effectuée en utilisant la décomposition de Cholesky de la matrice de corrélation …

1
Comment calculer une taille d'échantillon pour valider la correcte / inexactitude des enregistrements dans un tableau de données?
J'ai lu les réponses existantes sur CrossValidated (et ailleurs en ligne) et je ne trouve pas ce que je recherche, mais veuillez me signaler les sources existantes si je les ai manquées. Disons que j'ai un ensemble de données de N = 1000 enregistrements, dont chacun peut être échantillonné manuellement …

3
Trouvez la distribution et passez à la distribution normale
J'ai des données qui décrivent la fréquence à laquelle un événement se produit pendant une heure ("nombre par heure", nph) et la durée des événements ("durée en secondes par heure", dph). Ce sont les données d'origine: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.