J'essaie de trouver la meilleure façon de prédire le montant du paiement pour une agence de recouvrement. La variable dépendante n'est non nulle que lorsqu'un paiement a été effectué. Naturellement, il y a un nombre écrasant de zéros parce que la plupart des gens ne peuvent pas être joints ou ne peuvent pas rembourser la dette.
Il existe également une très forte corrélation négative entre le montant de la dette et la probabilité d'effectuer un paiement. En règle générale, je créerais un modèle logistique pour prédire la probabilité de rémunération / non-rémunération, mais cela a la conséquence malheureuse de trouver les personnes ayant les soldes les plus bas.
Existe-t-il un moyen de combiner un modèle logistique pay / non-pay avec un modèle distinct prédisant le montant du paiement?