J'ai affaire à un problème de classification binaire supervisé. Je voudrais utiliser le package GBM pour classer les individus comme non infectés / infectés. J'ai 15 fois plus de personnes non infectées que de personnes infectées.
Je me demandais si les modèles GBM souffraient en cas de tailles de classe déséquilibrées? Je n'ai trouvé aucune référence répondant à cette question.
J'ai essayé d'ajuster les poids en attribuant un poids de 1 aux individus non infectés et un poids de 15 aux personnes infectées, mais j'ai obtenu de mauvais résultats.