J'ai récemment reçu une révision de mon article de recherche et voici le commentaire de l'examinateur sur mon article:
les résultats obtenus à partir d'un modèle ne sont pas tout à fait convaincants, en particulier la régression linéaire présente généralement des lacunes dans le traitement des valeurs aberrantes. Je suggère aux auteurs d'essayer également la régression logistique et de comparer les résultats correspondants avec les résultats actuels. Si des observations similaires étaient obtenues, les résultats seraient plus solides.
Le commentaire de l'examinateur est-il correct? La régression logistique est-elle meilleure que la régression linéaire multiple?
Le problème est que ma variable dépendante n'est pas catégorique, c'est une variable d'échelle. Que puis-je faire maintenant? Quelle autre méthode de régression recommandez-vous pour évaluer mon modèle?
Le score est une variable dépendante dans le tableau suivant. La récence, la fréquence, l'ancienneté et le dernier score sont des variables indépendantes.
J'ai extrait ces variables d'un site et je fais l'hypothèse que ces variables indépendantes ont un effet significatif sur le score . Par conséquent, je représente les modèles suivants:
Soit dit en passant, la valeur de R au carré pour ce modèle linéaire est de 0,316! Le critique a également commenté cette valeur:
alors les résultats ne sont pas convaincants car il n'y a pas d'indicateur sur la qualité des coefficients appris. Un petit R ^ 2 ne peut pas indiquer de bonnes performances car le modèle peut être sur-ajusté.
Est-ce que 0,316 est très bas pour R au carré? Dans les articles précédents, j'ai vu beaucoup de valeurs similaires.