Questions marquées «bayesian»

L'inférence bayésienne est une méthode d'inférence statistique qui repose sur le traitement des paramètres du modèle comme des variables aléatoires et l'application du théorème de Bayes pour déduire des déclarations de probabilité subjectives sur les paramètres ou les hypothèses, conditionnelles à l'ensemble de données observé.


3
Le chercheur 1 exécute 1000 régressions, le chercheur 2 exécute seulement 1, les deux obtiennent les mêmes résultats - devraient-ils faire des inférences différentes?
Imaginez qu'un chercheur explore un ensemble de données et exécute 1000 régressions différentes et qu'il trouve entre elles une relation intéressante. Imaginez maintenant qu'un autre chercheur avec les mêmes données exécute une seule régression, et il s'avère que c'est le même que l'autre chercheur a pris 1000 régressions pour trouver. …

2
Fiabilité du mode à partir d'un échantillon MCMC
Dans son livre Doing Bayesian Data Analysis, John Kruschke déclare qu'en utilisant JAGS de R ... l'estimation du mode à partir d'un échantillon MCMC peut être plutôt instable car l'estimation est basée sur un algorithme de lissage qui peut être sensible aux bosses et ondulations aléatoires dans l'échantillon MCMC. ( …
12 bayesian  mcmc  mode 

3
Qu'est-ce que cela signifie pour quelque chose d'avoir de bonnes propriétés fréquentistes?
J'ai souvent entendu cette phrase, mais je n'ai jamais entièrement compris ce qu'elle signifie. L'expression "bonnes propriétés fréquentistes" compte actuellement environ 2750 visites sur google, 536 sur scholar.google.com et 4 sur stats.stackexchange.com . La chose la plus proche que j'ai trouvée à une définition claire vient de la dernière diapositive …


2
Justification du conjugué avant?
Outre l'utilisabilité, existe-t-il une justification épistémique (mathématique, philosophique, heuristique, etc.) pour utiliser des antérieurs conjugués? Ou est-ce juste que c'est généralement une approximation suffisamment bonne et rend les choses beaucoup plus faciles?



2
Quels sont les paramètres d'un postérieur de Wishart-Wishart?
Lors de l'inférence de la matrice de précision ΛΛ\boldsymbol{\Lambda} d'une distribution normale utilisée pour générer NNN vecteurs D-dimension x1,..,xNx1,..,xN\mathbf{x_1},..,\mathbf{x_N} xi∼N(μ,Λ−1)xi∼N(μ,Λ−1)\begin{align} \mathbf{x_i} &\sim \mathcal{N}(\boldsymbol{\mu, \Lambda^{-1}}) \\ \end{align} nous plaçons généralement un Wishart prioritaire sur ΛΛ\boldsymbol{\Lambda} car la distribution Wishart est le conjugué avant pour la précision d'une distribution normale multivariée avec …


5
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?
J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


2
Score au carré du renseignement et détermination du gagnant
Il existe un podcast NPR appelé Intelligence Squared. Chaque épisode est la diffusion d'un débat en direct sur une déclaration litigieuse telle que "Le 2e amendement n'est plus pertinent" ou "L'action positive sur les campus universitaires fait plus de mal que de bien". Quatre représentants débattent - deux pour la …
12 bayesian  rating 

3
Bayesian vs MLE, problème de surajustement
Dans le livre de Bishop's PRML, il dit que le sur-ajustement est un problème avec l'estimation de maximum de vraisemblance (MLE), et que le bayésien peut l'éviter. Mais je pense que le sur-ajustement est un problème plus lié à la sélection du modèle, pas à la méthode utilisée pour faire …

1
Ratio de probabilités vs ratio de PDF
J'utilise Bayes pour résoudre un problème de clustering. Après avoir fait quelques calculs, je me retrouve avec la nécessité d'obtenir le rapport de deux probabilités: P(A)/P(B)P(A)/P(B)P(A)/P(B) pouvoir obtenir . Ces probabilités sont obtenues par intégration de deux KDE multivariés 2D différents comme expliqué dans cette réponse :P(H|D)P(H|D)P(H|D) P(A)=∬x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdyP(A)=∬x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdyP(A) = \iint_{x, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.