Jeux de coalition et valeur de Shapley utilisés pour évaluer la contribution variable explicative


1

J'ai un problème qui, à première vue, ne semble pas être un jeu de coalition, mais pourrait plutôt être décrit comme une régression logistique avec toutes les variables dichotomiques: 1 variable de réponse Y (Je l'appellerais plus tard en tant que caractéristique / étoile violette) et 5 variables explicatives A B C D et E (aussi binaire).

J'essaie de déduire quelles variables explicatives contribuent le plus à Y et, de préférence, d'évaluer d'une manière ou d'une autre leur gravité. (quelque chose comme les prédicteurs de classement, la sélection de variables, etc.) et je trouve de fortes similitudes avec la valeur de Shapley.

Cela ressemble beaucoup aux jeux de coalition, en raison de sa nature fortement coopérative, mais je ne suis pas sûr de pouvoir l’utiliser dans ce cas particulier. Le problème principal de cette approche est indiqué tout en bas en gras.

Pourriez-vous jeter un coup d'œil à la situation ci-dessous et recommander quelques méthodes pour expliquer l'utilisation de la valeur de Shapley afin de déduire l'explication et dans quelle mesure contribuer le plus à la réponse Y (entité / étoile violette)

Disons que nous avons cinq objets différents désignés par des boules étiquetées: A, B, C, D, E créant des sous-ensembles et l'unique particularité d'intérêt marqué comme étoile violette. Si l'étoile est remplie, l'élément est présent dans un ensemble spécifique, tandis que l'étoile creuse en indique l'absence.

enter image description here

N'importe quel sous-ensemble de ces cinq objets (il existe 2 types possibles de tels sous-ensembles non vides) peut apparaître plusieurs fois, parfois avec la fonctionnalité présente et parfois sans cela, comme illustré ci-dessous, où il y a six occurrences de l'ensemble complet et où $ \ frac {2} {3} $ ont la fonctionnalité.

Nous pouvons supposer (si cela est nécessaire) qu'il y a toujours au moins une instance de l'ensemble complet avec fonction présente (par exemple, celle marquée d’une enveloppe rouge plus épaisse).

Pour chacun des sous-ensembles non vides possibles de 2 ^ 5 - 1 $ $, nous avons trois valeurs, par ex. pour (A, C, E):

  • $ F_ {ACE} $ - nombre de toutes les occurrences du sous-ensemble (A, C, E) \ textbf {avec} la fonctionnalité.
  • $ N_ {ACE} $ - nombre de toutes les occurrences du sous-ensemble (A, C, E) \ textbf {sans} l'entité.
  • $ T_ {ACE} = F_ {ACE} + N_ {ACE} $ - nombre total de toutes les apparences du sous-ensemble (A, C, E).

Les cardinalités des instances $ T_X $ de chaque type de sous-ensemble $ X $ peuvent être différentes, mais il existe une règle très évidente et assez triviale qui       si $ X \ sous-ensemble Y $ alors $ T_X \ geq T_Y $. Par exemple, $ (A, C, E) \ sous-ensemble (A, B, C, D, E) $ donc $ T_ {ACE} \ geq T_ {ABCDE} $.       C’est parce que toute instance de sous-ensemble (A, B, C, D, E) est en même temps une instance de (A, C, E), mais pour plus étroite (A, C, E)       nous pouvons avoir plus d'instances.

Dans cette description, j’utilise six instances pour chaque type de sous-ensemble, simplement en raison d’un espace limité pour les images et de ces six.               Les instances ont pour but de refléter la proportion globale entre les instances ayant ou non la fonctionnalité.

Parmi tous ces types $ 2 ^ 5 - 1 $, certains sont plus susceptibles d'avoir la fonctionnalité (pour ce sous-ensemble / type particulier, il y a plus d'instances avec la fonctionnalité que sans), alors que les autres types sont plus susceptibles de ne pas en disposer. Veuillez regarder les deux figures ci-dessous et les chiffres suivants:

enter image description here enter image description here $$ \ frac {F_ {ACE}} {T_ {ACE}} = \ frac {5} {6}, ~~ \ frac {F_ {BD}} {T_ {BD}} = \ frac {1} {6}, ~~ \ frac {F_ {ABCDE}} {T_ {ABCDE}} = \ frac {4} {6} ~ \ text {(la situation de la toute première image)}} $$ Une propriété manifestement évidente est que, dans mon modèle, le rapport $ \ frac {F} {T} $ n’est pas monotone (dans aucun sens) par rapport à relation d'inclusion.

Et enfin, la propriété la plus cruciale que j'aimerais créer avec mon modèle est une sorte d'interaction coopérative entre les objets d'un sous-ensemble, qui est la dernière chose que je vais décrire ci-dessous. Un instant auparavant, nous avions remarqué que le sous-ensemble (A, C, D) était exceptionnellement favorable à l'apparence de l'entité. Nous avons donc porté une attention particulière à ses singletons constitutifs et à leurs ratios correspondants: $$ \ frac {F_A} {T_A} = \ frac {2} {6} ~~ \ text {(2e et 4e)}, ~~ \ frac {F_C} {T_C} = \ frac {2} {6} ~ ~ \ text {(2nd & 3ème)}, ~~ \ frac {F_E} {T_E} = \ frac {1} {6} ~~ \ text {(2e seulement)} $$ enter image description here enter image description here enter image description here

Même maintenant, nous pouvons clairement voir une sorte de coopérative, puisque ces trois singletons (A), (C) et (E) ne couvrent au total que trois sous-ensembles {2nd, 3rd, 4th} = {2nd, 4th} $ \ cup $ {2nd, 3rd} $ \ cup $ {2nd}, alors que le sous-ensemble (A, C, E) déclenche la fonctionnalité dans la plupart des sous-ensembles sauf le premier.

De plus, la fusion de A avec E ou de C avec E ne donne aucun effet de coalition supplémentaire, de sorte que E lui-même contribue peu à l’effet global.

enter image description here enter image description here

Cependant, la fusion de A avec C donne une interaction significative résultant de l’apparence de la fonction dans plus d’instances que ce instances de sommation: $ \ {2nd, 3rd, 4th, 6th \} $ vs. $ \ {2nd, 3rd, 4th \} $. La 6ème instance est cet effet de coalition.

enter image description here

Néanmoins, le E est nécessaire pour déclencher tout le potentiel et révéler la fonctionnalité également dans le 5ème cas, comme illustré dans la deuxième figure.

Pour résumer, je voudrais déduire des données quel objet est favorable à l’apparence de la fonction. Dans notre exemple, nous pouvons voir clairement que A et C sont très propices (en coopération avec d’autres), E n’est pas très utile, mais est nécessaire pour atteindre son plein potentiel, alors que B et D ne semblent pas avoir d’effet coopératif sur la caractéristique.

Le principal problème lié à l’incorporation de la valeur Shapley: j’aimerais utiliser le ratio $ \ frac {F_X} {T_X} $ comme fonction caractéristique $ v (X) $ pour le sous-ensemble particulier $ X $ ($ v: 2 ^ {5} \ mapsto \ mathbb {R} $), mais ce rapport n’est pas monotone en ce qui concerne la relation de respect pour l’inclusion et la coalition totale $ (A, B, C, D, E) $ aurait une valeur plus petite que celle plus étroite $ (A, C, E) $ (comparer les 1er et 2ème chiffres). Je ne pense pas que B ou C devrait apporter une contribution négative, plutôt neutre.

Voyez-vous comment puis-je infere une telle contribution?

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.