Disons que le problème suivant nous est posé:
Prévoyez quels clients sont les plus susceptibles d'arrêter d'acheter dans notre boutique au cours des 3 prochains mois.
Pour chaque client, nous connaissons le mois où l'on a commencé à acheter dans notre boutique et, en outre, nous avons de nombreuses fonctionnalités comportementales dans les agrégats mensuels. Le client «le plus âgé» achète depuis cinquante mois; notons le temps écoulé depuis qu'un client a commencé à acheter par ( ). On peut supposer que le nombre de clients est très important. Si un client cesse d'acheter pendant trois mois, puis revient, il est alors traité comme un nouveau client, de sorte qu'un événement (arrêt d'achat) ne peut se produire qu'une seule fois.t ∈ [ 0 , 50 ]
Deux solutions me viennent à l'esprit:
Régression logistique - Pour chaque client et chaque mois (peut-être à l'exception des 3 derniers mois), nous pouvons dire si un client a cessé d'acheter ou non, afin que nous puissions faire des échantillons roulants avec une observation par client et par mois. Nous pouvons utiliser le nombre de mois depuis le début comme variable catégorielle pour obtenir un équivalent de la fonction de risque de base.
Modèle Cox étendu - Ce problème peut également être modélisé à l'aide du modèle Cox étendu. Il semble que ce problème soit plus adapté à l'analyse de survie.
Question: Quels sont les avantages de l'analyse de survie dans des problèmes similaires? L'analyse de survie a été inventée pour une raison quelconque, il doit donc y avoir un sérieux avantage.
Mes connaissances en analyse de survie ne sont pas très approfondies et je pense que la plupart des avantages potentiels du modèle de Cox peuvent également être obtenus en utilisant la régression logistique.
- L'équivalent du modèle de Cox stratifié peut être obtenu en utilisant une interaction de et de la variable de stratification.
- Le modèle de Cox d'interaction peut être obtenu en plongeant la population en plusieurs sous-populations et en estimant LR pour chaque sous-population.
Le seul avantage que je vois est que le modèle Cox est plus flexible; par exemple, nous pouvons facilement calculer la probabilité qu'un client cesse d'acheter en 6 mois.