Supposons qu'un modèle de régression logistique soit utilisé pour prédire si un acheteur en ligne achètera un produit (résultat: achat), après avoir cliqué sur un ensemble d'annonces en ligne (prédicteurs: Ad1, Ad2 et Ad3).
Le résultat est une variable binaire: 1 (achetée) ou 0 (non purgée). Les prédicteurs sont également des variables binaires: 1 (cliqué) ou 0 (non cliqué). Donc, toutes les variables sont sur la même échelle.
Si les coefficients résultants de Ad1, Ad2 et Ad3 sont 0,1, 0,2 et 03, nous pouvons conclure que Ad3 est plus important que Ad2 et Ad2 est plus important que Ad1. De plus, comme toutes les variables sont sur la même échelle, les coefficients normalisés et non normalisés devraient être les mêmes, et nous pouvons en outre conclure que Ad2 est deux fois plus important que Ad1 en termes d'influence sur le niveau logit (log-odds).
Mais dans la pratique, nous nous soucions davantage de la façon de comparer et d'interpréter l'importance relative des variables en termes de niveau p (probabilité d'achat), et non du logit (log-odds).
La question est donc la suivante: existe-t-il une approche pour quantifier l'importance relative de ces variables en termes de p?