Je travaille sur une nouvelle méthode d'analyse et d'analyse de jeux de données pour identifier et isoler les sous-groupes d'une population sans connaître à l'avance les caractéristiques d'aucun sous-groupe. Bien que la méthode fonctionne assez bien avec des échantillons de données artificiels (c'est-à-dire des ensembles de données créés spécifiquement dans le but d'identifier et de séparer des sous-ensembles de la population), j'aimerais essayer de la tester avec des données réelles.
Ce que je recherche, c'est une source de données librement disponible (c'est-à-dire non confidentielle et non exclusive). De préférence, celui-ci contient des distributions bimodales ou multimodales ou est évidemment composé de plusieurs sous-ensembles qui ne peuvent pas être facilement séparés par des moyens traditionnels. Où pourrais-je aller pour trouver une telle information?