Supposons que je m'intéresse à trois classes , c 2 , c 3 . Mais mon jeu de données contient en fait plusieurs autres classes réelles ( c j ) n j = 4 .
La réponse évidente est de définir une nouvelle classe c 4 qui fait référence à toutes les classes c j , j > 3 , mais je soupçonne que ce n'est pas une bonne idée puisque les échantillons c 4 seront rares et très semblables les uns aux autres.
Pour visualiser ce que je veux dire, je suppose que les deux variables suivantes espace et les classes , c 2 , c 3 , c 4 = ⋃ n j = 4 c j sont représentés en rouge, jusqu'à, vert et noir respectivement. Voici à quoi je pense que mes données ressembleraient.
Existe-t-il un moyen standard d'aborder ce problème? Quel serait le classificateur le plus efficace et pourquoi?