Si nous avons un petit échantillon, la distribution antérieure influencera-t-elle beaucoup la distribution postérieure?
Si nous avons un petit échantillon, la distribution antérieure influencera-t-elle beaucoup la distribution postérieure?
Réponses:
Oui. La distribution postérieure d'un paramètre , étant donné un ensemble de données X peut être écrite comme
ou, comme cela est plus couramment affiché sur l'échelle logarithmique,
La log-vraisemblance, , est proportionnelle à la taille de l'échantillon , car elle est fonction des données, contrairement à la densité antérieure. Par conséquent, à mesure que la taille de l'échantillon augmente, la valeur absolue de L ( θ ; X ) devient plus grande tandis que log ( p ( θ ) ) reste fixe (pour une valeur fixe de θ ), donc la somme L ( θ ; X ) devient plus fortement influencé par L ( θ ; X ) à mesure que la taille de l'échantillon augmente.
Par conséquent, pour répondre directement à votre question - la distribution antérieure devient de moins en moins pertinente à mesure qu'elle est dépassée par la probabilité. Ainsi, pour une petite taille d'échantillon, la distribution antérieure joue un rôle beaucoup plus important. Cela est conforme à l'intuition, car vous vous attendez à ce que les spécifications antérieures jouent un rôle plus important lorsqu'il n'y a pas beaucoup de données disponibles pour les réfuter, alors que si la taille de l'échantillon est très grande, le signal présent dans les données l'emportera sur tout ce qui a priori les croyances ont été intégrées au modèle.
Voici une tentative pour illustrer le dernier paragraphe de l'excellente réponse (+1) de Macro. Il montre deux a priori pour le paramètre dans la distribution B i n o m i a l ( n , p ) . Pour quelques n différents , les distributions postérieures sont affichées lorsque x = n / 2 a été observé. Comme n croît, les dents postérieures deviennent de plus en plus concentrée autour de 1 / 2 .
Pour la différence est assez grande, mais pour n = 50, il n'y a pratiquement pas de différence.
Les deux prieurs ci - dessous sont (noir) et B e t un ( 2 , 2 ) (rouge). Les postérieurs ont les mêmes couleurs que les prieurs dont ils sont dérivés.
(Notez que pour de nombreux autres modèles et autres priors, ne sera pas suffisant pour que le précédent ne compte pas!)