Nous avons un ensemble d'échantillons biologiques qui était assez cher à obtenir. Nous avons soumis ces échantillons à une série de tests pour générer des données qui sont utilisées pour construire un modèle prédictif. À cette fin, nous avons divisé les échantillons en ensembles d'apprentissage (70%) et d'essai (30%). Nous avons réussi à créer un modèle et à l'appliquer sur l'ensemble de test pour découvrir que les performances étaient "moins qu'optimales". Les expérimentateurs veulent maintenant améliorer les tests biologiques afin de créer un meilleur modèle. À condition que nous ne puissions pas obtenir de nouveaux échantillons, nous suggéreriez-vous de remélanger les échantillons pour créer de nouveaux ensembles de formation et de validation ou de vous en tenir à la division d'origine. (Nous n'avons aucune indication que la division était problématique).