Questions marquées «goodness-of-fit»

Les tests d'adéquation indiquent s'il est raisonnable ou non de supposer qu'un échantillon aléatoire provient d'une distribution spécifique.

5
Puis-je tester l'hypothèse pour les données normales asymétriques?
J'ai une collection de données, que je pensais à l'origine être normalement distribuée. Ensuite, je l'ai regardé et j'ai réalisé que ce n'était pas le cas, principalement parce que les données sont biaisées, et j'ai également fait un test de shapiro-wilks. Je voudrais toujours l'analyser en utilisant des méthodes statistiques, …

2
Test de Kolmogorov – Smirnov: la valeur p et la statistique du test ks diminuent à mesure que la taille de l'échantillon augmente
Pourquoi les valeurs de p et les statistiques du test ks diminuent avec l'augmentation de la taille de l'échantillon? Prenez ce code Python comme exemple: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = …


3
Comment visualiser la qualité de l'ajustement bayésien pour la régression logistique
Pour un problème de régression logistique bayésienne, j'ai créé une distribution prédictive postérieure. J'échantillonne à partir de la distribution prédictive et reçois des milliers d'échantillons de (0,1) pour chaque observation que j'ai. Visualiser la qualité de l'ajustement est loin d'être intéressant, par exemple: Ce graphique montre les 10 000 échantillons …



1
Comment dessiner un graphique ajusté et un graphique réel de la distribution gamma dans un seul graphique?
Chargez le package nécessaire. library(ggplot2) library(MASS) Générez 10 000 nombres adaptés à la distribution gamma. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Dessinez la fonction de densité de probabilité, supposant que nous ne savons pas à quelle distribution x correspond. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 …

4
Modèle d'historique d'événement à temps discret (survie) dans R
J'essaie d'adapter un modèle à temps discret dans R, mais je ne sais pas comment le faire. J'ai lu que vous pouvez organiser la variable dépendante dans différentes lignes, une pour chaque observation de temps, et utiliser la glmfonction avec un lien logit ou cloglog. En ce sens, j'ai trois …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

4
Comment puis-je calculer la statistique de test Pearson pour le manque d'ajustement sur un modèle de régression logistique dans R?
Le rapport de vraisemblance (aka déviance) statistique et test de manque d'ajustement (ou qualité d'ajustement) est assez simple à obtenir pour un modèle de régression logistique (ajustement à l'aide de la fonction) dans R. Cependant, il peut être il est facile de faire en sorte que le nombre de cellules …




2
Calculer la courbe ROC pour les données
Donc, j'ai 16 essais dans lesquels j'essaie d'authentifier une personne à partir d'un trait biométrique en utilisant Hamming Distance. Mon seuil est fixé à 3,5. Mes données sont ci-dessous et seul l'essai 1 est un vrai positif: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
Qualité de l'ajustement pour les données discrètes: meilleure approche
Les données: Aux fins de cette question / communication, nous pouvons supposer que les données ressemblent rnbinom(1000,size=0.1,prob=0.01)à R, qui génère un échantillon aléatoire de 1 000 observations à partir d'une distribution binomiale négative (avec size=0.1et probabilité de succès prob=0.01). Il s'agit de la paramétrisation où la variable aléatoire représente le …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.