J'ai un ensemble de données qui a un attribut de classe binaire. Il y a 623 instances de classe +1 (cancer positif) et 101 671 instances de classe -1 (cancer négatif).
J'ai essayé divers algorithmes (Naive Bayes, Random Forest, AODE, C4.5) et tous ont des taux de faux négatifs inacceptables. Random Forest a la précision globale de prédiction la plus élevée (99,5%) et le taux de faux négatifs le plus bas, mais il manque encore 79% des classes positives (c'est-à-dire qu'il ne parvient pas à détecter 79% des tumeurs malignes).
Des idées pour améliorer cette situation?
Merci!