Je parcourais la documentation de Stan qui peut être téléchargée ici . J'étais particulièrement intéressé par leur implémentation du diagnostic Gelman-Rubin. Le document original Gelman & Rubin (1992) définit le facteur de réduction d'échelle potentiel (PSRF) comme suit:
Soit la ème chaîne de Markov échantillonnée, et qu'il y ait globalement chaînes indépendantes échantillonnées. Soit la moyenne de la ème chaîne, et la moyenne globale. Définissez,
Définir V = ( N - 1 Le PSRF est estimé avec √
La documentation de Stan à la page 349 ignore le terme avec et supprime également le terme multiplicatif ( M + 1 ) / M. Voici leur formule,
L'estimateur de variance est Enfin, la statistique potentiel de réduction d'échelle est définie par R = √
D'après ce que j'ai pu voir, ils ne fournissent pas de référence pour ce changement de formule, et ils n'en discutent pas non plus. Habituellement, n'est pas trop grand et peut souvent être aussi bas que 2 , donc ( M + 1 ) / M ne doit pas être ignoré, même si le terme d f peut être approximé par 1.
D'où vient donc cette formule?
EDIT: J'ai trouvé une réponse partielle à la question "d' où vient cette formule? ", Dans la mesure où le livre Bayesian Data Analysis de Gelman, Carlin, Stern et Rubin (deuxième édition) a exactement la même formule. Cependant, le livre n'explique pas comment / pourquoi il est justifié d'ignorer ces termes?