Quelle est la différence entre DP et CRP?
Le processus de restaurant chinois (CRP) est une distribution sur des partitions d'entiers . La connexion au processus de Dirichlet (DP) existe grâce au théorème de De Finetti.
Théorème de De Finetti: Supposons que nous ayons un processus aléatoire(θ1, … ,θN)qui est infiniment échangeable , alors la probabilité conjointep (θ1, … ,θN) a une représentation sous forme de mélange:
p (θ1, … ,θN) = ∫réP( G )∏i = 1NG (θje)
pour une variable aléatoire g.
La propriété d' échangeabilité signifie que nous ne nous soucions pas non plus des indices des tables (nous ne nommons pas les tables) et nous ne nous soucions pas de l'ordre des clients à une table particulière. La partition des clients en différents ensembles est la seule structure qui nous intéresse. Cela signifie que, étant donné une partition, nous n'avons pas besoin de connaître les affectations particulières des clients aux tables, nous avons seulement besoin de connaître le nombre de clients à chaque table.
Le théorème de De Finetti n'aide pas à trouver la distribution g. Il indique seulement qu'il devrait exister.
Le processus de Dirichlet est un précédent sur les distributions . De manière informelle, vous avez introduit une distribution de probabilité et lorsque vous en échantillonnez, vous obtenez une distribution de probabilité après la distribution de probabilité.
Le lien entre les deux peut être établi en prouvant que si g est échantillonné à partir d'un processus de Dirichlet, l'équation dans le théorème de De Finetti tient pour ce particulier g.
Si
G ∼ D P( α , H)
puis
p ( {θ( z= 0)0, … ,θ( z= 0)n0} , … , {θ( z= k)0, … ,θ( z= k)nk} ) =αkΓ ( α )Γ ( α + n )∏i = 0kΓ (nje)
Notez que p (θ1, … ,θN)est décrit par un CRP à travers des probabilités pour des partitions particulières. Iciz= i désigne un index de table je. Etnje est le nombre de clients à table je. Par souci d'exhaustivité, rappelez-vous que leD P est:
{ G (UNE1) , … , G (UNEk) } ∼ D i r i c h l e t ( α H(UNE1) , … , Α H(UNEk) )
Je pense qu'il ressort clairement de cette exposition que la connexion est là, mais ne doit pas être considérée comme triviale. Notez également que je n'ai pas décrit le CRP dans le sens d'une distribution conditionnelle sur les clients individuels entrants. Cela ajouterait encore une autre étape conceptuelle entre le CRP et le DP. Mon conseil: n'hésitez pas à être mal à l'aise pour comprendre directement leur relation et commencez à jouer avec la description des distributions conjointes et marginales jusqu'à ce que vous reproduisiez la connexion. Le CRP est obtenu en marginalisantg du DP.
Pour le lien entre la probabilité conjointe et la description séquentielle du CRP, voir [1].
Et si l'échange n'est pas valable?
Si l'échangeabilité ne tient pas, nous ne parlons plus du DP ou du CRP, mais du processus de Dirichlet dépendant et du processus de restaurant chinois dépendant. Et naturellement, la connexion entre eux se perd!
Voir [2] pour plus de détails. Le CRP dépendant décrit quel client veut s'asseoir avec quel (seul) autre client. En regroupant toutes les relations client-client, nous pouvons une affectation sur des tables. Le CRP dépendant n'est pas marginalement invariant: la probabilité d'une partition lors de la suppression d'un client dépend également de ce même client. Au contraire, le DP Dépendant est souvent défini par ce très marginal:gt∼ D P( α , H). IciH est par exemple une distribution Dirichlet elle-même ou toute distribution qui provoque gt et gt′ être lié.
Il existe de nombreuses autres généralisations possibles, certaines admettront une représentation sur les partitions ainsi que sur les distributions, comme le processus de restaurant chinois avec deux paramètres avec le processus Pitman-Yor, ou le processus de buffet indien avec le processus bêta [3] . Certains ne le feront pas.
- [1] : Tutoriel sur les modèles bayésiens non paramétriques (2011) Gershman et Blei
- [2] : Processus de restaurants chinois dépendants de la distance (2011) Blei et Frazier
- [3] : Processus hiérarchiques bêta et processus de buffet indien (2007) Thibaux et Jordanie