J'apprends à utiliser le package BTYD qui utilise le modèle Pareto / NBD pour prédire quand un client devrait revenir. Cependant, toute la littérature sur ce modèle est pleine de mathématiques et il ne semble pas y avoir d'explication simple / conceptuelle du fonctionnement de ce modèle. Est-il possible de comprendre le modèle Pareto / NBD pour les non-mathématiciens? J'ai parcouru ce fameux article de Fader . Le modèle Pareto / NBD fait les hypothèses suivantes:
je. Lorsqu'il est actif, le nombre de transactions effectuées par un client dans une période de temps t est réparti Poisson avec le taux de transaction λ.
ii. L'hétérogénéité des taux de transaction entre les clients suit une distribution gamma avec le paramètre de forme r et le paramètre d'échelle α.
iii. Chaque client a une «durée de vie» non observée de longueur τ. Ce point auquel le client devient inactif est distribué de façon exponentielle avec un taux de décrochage µ.
iv) L'hétérogénéité des taux d'abandon entre les clients suit une distribution gamma avec le paramètre de forme s et le paramètre d'échelle β.
v. Le taux de transaction λ et le taux d'abandon µ varient indépendamment d'un client à l'autre. "
Je ne comprends pas la (intuition derrière) la justification des hypothèses (ii), (iii) et (iv). Pourquoi seulement ces distributions, pourquoi pas les autres?
Les hypothèses du modèle BG / NBD sont également:
i.) Lorsqu'il est actif, le nombre de transactions effectuées par un client suit un processus de Poisson avec le taux de transaction λ. Cela revient à supposer que le temps entre les transactions est distribué de façon exponentielle avec le taux de transaction λ
ii) L'hétérogénéité de λ suit une distribution gamma
iii) Après toute transaction, un client devient inactif avec probabilité p. Par conséquent, le point auquel le client «abandonne» est réparti entre les transactions selon une distribution géométrique (décalée) avec pmf
iv) L'hétérogénéité de p suit une distribution bêta
La rationalité (intuitive) des hypothèses (ii), (iii) et (iv) n'est également pas du tout évidente.
Je serai reconnaissant pour toute aide. Merci.