La raison de définir le score F-beta avec est exactement la citation que vous fournissez (c'est-à-dire vouloir attacher autant d'importance à rappeler que de précision) étant donné une définition particulière de ce que signifie attacher fois plus d’importance à rappeler que de précision.β2ββ
La manière particulière de définir l'importance relative des deux métriques qui conduit à la formulation peut être trouvée dans Information Retrieval (Van Rijsbergen, 1979):β2
Définition: L'importance relative qu'un utilisateur attache à la précision et au rappel est le rapport auquel , où est la mesure de l'efficacité basée sur la précision et le rappel.P/R∂E/∂R=∂E/∂PE=E(P,R)
La motivation pour cela est:
La façon la plus simple que je connaisse de quantifier cela est de spécifier le rapport auquel l'utilisateur est prêt à échanger un incrément de précision pour une perte de rappel égale.P/R
Pour voir que cela conduit à la formulation nous pouvons commencer par la formule générale pour la moyenne harmonique pondérée des et et calculer leurs dérivées partielles par rapport à et . La source citée utilisations (pour « mesure de l' efficacité »), qui est juste et l'explication est équivalente que l' on considère ou .β2PRPRE1−FEF
F=1(αP+1−αR)
∂F/∂P=α(αP+1−αR)2P2
∂F/∂R=1−α(αP+1−αR)2R2
Maintenant, si les dérivées sont égales, la restriction entre la relation et le rapport limitée . Étant donné que nous souhaitons attacher fois autant d'importance à rappeler que de précision, nous considérerons le rapport 1 :αP/RβR/P
∂F/∂P=∂F/∂R→αP2=1−αR2→RP=1−αα−−−−−√
Définir comme ce ratio et réorganiser pour donne les pondérations en termes de :βαβ2
β=1−αα−−−−−√→β2=1−αα→β2+1=1α→α=1β2+1
1−α=1−1β2+1→β2β2+1
On obtient:
F=1(1β2+11P+β2β2+11R)
Qui peut être réorganisé pour donner le formulaire dans votre question.
Ainsi, étant donné la définition citée, si vous souhaitez attacher fois autant d'importance à rappeler que précision, alors la formulation devrait être utilisée. Cette interprétation ne tient pas si l'on utilise . L'interprétation équivalente, moins intuitive, dans le cas où nous utilisons simplement serait que nous voulons attacher autant d'importance à rappeler que de précision.ββ2βββ−−√
Vous pouvez définir un score comme vous le suggérez, mais vous devez savoir que dans ce cas, soit l'interprétation discutée ne tient plus, soit vous impliquez une autre définition pour quantifier le compromis entre précision et rappel.
Notes de bas de page:
- P/R est utilisé dans la recherche d'informations mais cela semble être une faute de frappe, voir La vérité de la mesure F (Saski, 2007).
Références:
- CJ Van Rijsbergen. 1979. Information Retrieval (2e éd.), Pp.133-134
- Y. Sasaki. 2007. «La vérité de la mesure F», enseignement, matériel didactique