Je travaille sur un projet de Machine Learning avec des données déjà (fortement) biaisées par la sélection des données.
Supposons que vous ayez un ensemble de règles codées en dur. Comment construire un modèle d'apprentissage automatique pour le remplacer, alors que toutes les données qu'il peut utiliser sont des données déjà filtrées par ces règles?
Pour clarifier les choses, je suppose que le meilleur exemple serait l' évaluation du risque de crédit : la tâche consiste à filtrer tous les clients susceptibles de ne pas effectuer de paiement.
- Maintenant, les seules données (étiquetées) que vous avez proviennent de clients qui ont été acceptés par l'ensemble de règles, car ce n'est qu'après avoir accepté que vous verrez si quelqu'un paie ou non (évidemment). Vous ne savez pas à quel point l'ensemble de règles est bon et dans quelle mesure elles affecteront la distribution payée à non payée. En outre, vous disposez de données non étiquetées provenant des clients qui ont été refusées, toujours en raison de l'ensemble de règles. Vous ne savez donc pas ce qui se serait passé avec ces clients s'ils avaient été acceptés.
Par exemple, l'une des règles pourrait être: "Si l'âge du client <18 ans, alors n'acceptez pas"
Le classificateur n'a aucun moyen d'apprendre à gérer les clients qui ont été filtrés par ces règles. Comment le classificateur est-il censé apprendre le modèle ici?
Ignorer ce problème entraînerait l'exposition du modèle à des données qu'il n'a jamais rencontrées auparavant. Fondamentalement, je veux estimer la valeur de f (x) lorsque x est en dehors de [a, b] ici.