J'essaie de prédire une variable de réponse en régression linéaire qui devrait toujours être positive (coût par clic). C'est un montant monétaire. Dans AdWords, vous payez Google pour les clics sur vos annonces, et un nombre négatif signifie que Google vous paie lorsque les utilisateurs cliquent sur: P
Les prédicteurs sont tous des valeurs continues. Le Rsquared et le RMSE sont décents par rapport aux autres modèles, même hors échantillon:
RMSE Rsquared
1.4141477 0.8207303
Je ne peux pas redimensionner les prévisions, car c'est de l'argent, donc même un petit facteur de redimensionnement pourrait changer les coûts de manière significative.
Pour autant que je comprends, pour le modèle de régression, il n'y a rien de spécial à propos des nombres nuls et négatifs, donc il trouve le meilleur hyperplan de régression, que la sortie soit en partie négative.
Ceci est une toute première tentative, en utilisant toutes les variables dont je dispose. Il y a donc place à raffinement.
Existe-t-il un moyen de dire au modèle que la sortie ne peut pas être négative?