J'apprends la classification SVM et je rencontre un problème. Je ne sais pas si ce dilemme a une terminologie.
Supposons que nous aimerions classer les patients par SVM compte tenu des échantillons de personnes en bonne santé (des deux sexes) et de personnes atteintes d'un cancer du foie (des deux sexes). Si nous étiquetons l'échantillon de personnes en bonne santé comme classe 1 et les personnes atteintes de cancer comme classe 2, nous pouvons former un SVM binaire et obtenir un classificateur 1 pour prédire tout nouveau patient. Maintenant, imaginez un autre scénario. Supposons que nous divisons d'abord tous les échantillons par sexe avant la classification SVM. Pour chaque sexe, nous étiquetons toujours les patients sains et les patients cancéreux en 2 classes et formons un SVM binaire pour obtenir respectivement le classificateur 2 et le classificateur 3 pour les échantillons féminins et masculins. La question est de savoir s'il y a une nouvelle patiente, quel classificateur, 1 ou 2, devrait être utilisé pour obtenir une prédiction plus précise? Voici le dilemme des arguments que j'ai
(1) Lorsque le nombre d'échantillons est important, la prédiction doit être plus précise. Sur la base de cet argument, le classificateur 1 semble un bon choix.
(2) Cependant, si nous divisons d'abord les échantillons en groupes féminins et masculins, le classificateur 2 semble être un meilleur choix puisque le nouveau patient (échantillon d'essai inconnu) est une femme.
Ce genre de dilemme a-t-il une terminologie ou quelqu'un connaît-il d'autres informations ou comment résoudre un problème comme celui-ci? Je ne sais même pas si c'est une question légitime et désolé pour la question naïve à l'avance. Merci