Comment le journal (p (x, y)) normalise-t-il les informations mutuelles point par point?


9

J'essaie de comprendre la forme normalisée d'informations mutuelles ponctuelles.

npmi=pmi(x,y)log(p(x,y))

Pourquoi la probabilité log-jointe normalise-t-elle les informations mutuelles ponctuelles entre [-1, 1]?

L'information mutuelle point par point est:

pmi=log(p(x,y)p(x)p(y))

p (x, y) est borné par [0, 1] donc log (p (x, y)) est borné par (, 0]. Il semble que le log (p (x, y)) devrait en quelque sorte équilibrer les changements le numérateur, mais je ne comprends pas exactement comment. Cela me rappelle aussi l'entropie , mais encore une fois je ne comprends pas la relation exacte.h=log(p(x))


Pour commencer, les informations mutuelles ponctuelles utilisent un logarithme (je ne sais pas si sa faute de frappe ou si vous utilisez une autre quantité ).
Piotr Migdal

Réponses:


12

À partir de l'entrée Wikipedia sur les informations mutuelles ponctuelles :

Les informations mutuelles ponctuelles peuvent être normalisées entre [-1, + 1], ce qui donne -1 (dans la limite) pour ne jamais se produire ensemble, 0 pour l'indépendance et +1 pour une cooccurrence complète.

Pourquoi cela arrive-t-il? Eh bien, la définition de l'information mutuelle ponctuelle est

pmilog[p(x,y)p(x)p(y)]=logp(x,y)logp(x)logp(y),

alors que pour une information mutuelle normalisée ponctuelle, on entend :

npmipmilogp(x,y)=log[p(x)p(y)]logp(x,y)1.

Le quand il y a:

  • pas de co-occurrences, , donc nmpi est -1,logp(x,y)
  • co-occurrences au hasard, , donc nmpi vaut 0,logp(x,y)=log[p(x)p(y)]
  • cooccurrences complètes, , donc nmpi vaut 1.logp(x,y)=logp(x)=logp(y)

Ce serait une réponse plus complète pour montrer pourquoi npmi est sur l'intervalle . Voir ma preuve dans l'autre réponse. [1,1]
Hans

1

Bien que la réponse de Piotr Migdal soit informative en donnant les exemples où nmpi atteint trois valeurs extrêmes, cela ne prouve pas qu'il se trouve dans l'intervalle . Voici l'inégalité et sa dérivation. as pour tout événement . En divisant les deux côtés par le non négatif , nous avons [1,1]

logp(x,y)logp(x,y))logp(x)logp(y)=logp(x,y)p(x)p(y)=:pmi(x;y)=logp(y|x)+logp(y|x)logp(x,y)logp(x,y)
logp(A)0Ah(x,y):=logp(x,y)
1nmpi(x;y):=mpi(x;y)h(x,y)1.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.