Pourquoi le score bêta définit-il la bêta comme ça?


10

Il s'agit du score F beta:

Fβ=(1+β2)precisionrecall(β2precision)+recall

L'article de Wikipedia indique que .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Je n'ai pas compris l'idée. Pourquoi définir comme ça? Puis-je définir comme ceci:F ββFβ

Fβ=(1+β)precisionrecall(βprecision)+recall

Et comment montrer β times as much importance?


2
Découvrez une réponse plus récente ci-dessous qui inclut le calcul différentiel qui aborde "pourquoi la bêta au carré et non la bêta".
javadba

Réponses:


18

Laissant être le poids dans la première définition que vous fournissez et le poids dans la seconde, les deux définitions sont équivalentes lorsque vous définissez , donc ces deux définitions ne représentent que des différences de notation dans la définition du score . Je l'ai vu défini à la fois la première façon (par exemple sur la page wikipedia ) et la seconde (par exemple ici ).ββ~β~=β2Fβ

La mesure est obtenue en prenant la moyenne harmonique de précision et de rappel, à savoir l'inverse de la moyenne de l'inverse de précision et l'inverse de rappel:F1

F1=1121precision+121recall=2precisionrecallprecision+recall

Au lieu d'utiliser des poids dans le dénominateur qui sont égaux et totalisent 1 ( pour rappel et pour précision), nous pourrions plutôt attribuer des poids qui totalisent toujours 1 mais pour dont le poids au rappel est fois plus grand que le poids à la précision ( pour le rappel et pour la précision). Cela donne votre deuxième définition du score :1212βββ+11β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

Encore une fois, si nous avions utilisé au lieu de ici, nous serions arrivés à votre première définition, de sorte que les différences entre les deux définitions sont simplement notables.β2β


1
pourquoi ont-ils multiplié avec le terme de précision au lieu du terme de rappel? β
Anwarvic

1
Le calcul différentiel qui aborde "pourquoi Beta au carré et non Beta" est inclus dans une réponse plus récente ci-dessous.
javadba

@Anwarvic Ils ont multiplié avec le rappel inverse . Après prise en compte des et en expansion avec il y a un terme gaucheβ(1+β)precisionrecallβprecision
user2740

5

La raison de définir le score F-beta avec est exactement la citation que vous fournissez (c'est-à-dire vouloir attacher autant d'importance à rappeler que de précision) étant donné une définition particulière de ce que signifie attacher fois plus d’importance à rappeler que de précision.β2ββ

La manière particulière de définir l'importance relative des deux métriques qui conduit à la formulation peut être trouvée dans Information Retrieval (Van Rijsbergen, 1979):β2

Définition: L'importance relative qu'un utilisateur attache à la précision et au rappel est le rapport auquel , où est la mesure de l'efficacité basée sur la précision et le rappel.P/RE/R=E/PE=E(P,R)

La motivation pour cela est:

La façon la plus simple que je connaisse de quantifier cela est de spécifier le rapport auquel l'utilisateur est prêt à échanger un incrément de précision pour une perte de rappel égale.P/R

Pour voir que cela conduit à la formulation nous pouvons commencer par la formule générale pour la moyenne harmonique pondérée des et et calculer leurs dérivées partielles par rapport à et . La source citée utilisations (pour « mesure de l' efficacité »), qui est juste et l'explication est équivalente que l' on considère ou .β2PRPRE1FEF

F=1(αP+1αR)

F/P=α(αP+1αR)2P2

F/R=1α(αP+1αR)2R2

Maintenant, si les dérivées sont égales, la restriction entre la relation et le rapport limitée . Étant donné que nous souhaitons attacher fois autant d'importance à rappeler que de précision, nous considérerons le rapport 1 :αP/RβR/P

F/P=F/RαP2=1αR2RP=1αα

Définir comme ce ratio et réorganiser pour donne les pondérations en termes de :βαβ2

β=1ααβ2=1ααβ2+1=1αα=1β2+1

1α=11β2+1β2β2+1

On obtient:

F=1(1β2+11P+β2β2+11R)

Qui peut être réorganisé pour donner le formulaire dans votre question.

Ainsi, étant donné la définition citée, si vous souhaitez attacher fois autant d'importance à rappeler que précision, alors la formulation devrait être utilisée. Cette interprétation ne tient pas si l'on utilise . L'interprétation équivalente, moins intuitive, dans le cas où nous utilisons simplement serait que nous voulons attacher autant d'importance à rappeler que de précision.ββ2βββ

Vous pouvez définir un score comme vous le suggérez, mais vous devez savoir que dans ce cas, soit l'interprétation discutée ne tient plus, soit vous impliquez une autre définition pour quantifier le compromis entre précision et rappel.

Notes de bas de page:

  1. P/R est utilisé dans la recherche d'informations mais cela semble être une faute de frappe, voir La vérité de la mesure F (Saski, 2007).

Références:

  1. CJ Van Rijsbergen. 1979. Information Retrieval (2e éd.), Pp.133-134
  2. Y. Sasaki. 2007. «La vérité de la mesure F», enseignement, matériel didactique

1
Cela devrait être la réponse acceptée.
javadba

3

Pour signaler quelque chose rapidement.

Cela signifie que lorsque la valeur bêta augmente, vous appréciez davantage la précision.

En fait, je pense que c'est le contraire - étant donné que plus il vaut mieux dans la notation F-β, vous voulez que le dénominateur soit petit. Par conséquent, si vous diminuez β, le modèle est moins puni pour avoir un bon score de précision. Si vous augmentez β, alors le score F-β est plus puni lorsque la précision est élevée.

Si vous voulez pondérer le score F-β afin qu'il évalue la précision, β doit être 0 <β <1, où β-> 0 ne vaut que la précision (le numérateur devient très petit et la seule chose dans le dénominateur est le rappel, donc le score F-β diminue à mesure que le rappel augmente).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

La raison pour laquelle β ^ 2 est multiplié avec précision est simplement la façon dont les scores F sont définis. Cela signifie que lorsque la valeur bêta augmente, vous appréciez davantage la précision. Si vous vouliez le multiplier par un rappel qui fonctionnerait également, cela signifierait simplement que lorsque la valeur bêta augmente, vous valorisez davantage le rappel.


0

La valeur bêta supérieure à 1 signifie que nous voulons que notre modèle accorde plus d'attention au rappel de modèle par rapport à Precision. De l'autre, une valeur inférieure à 1 met davantage l'accent sur la précision.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.