Quels sont les ensembles de données librement disponibles pour la classification avec plus de 1000 entités (ou des points d’échantillons s’il contient des courbes)?
Il existe déjà un wiki de la communauté sur les jeux de données gratuits: Recherche d'échantillons de données disponibles gratuitement
Mais ici, il serait bien d’avoir une liste plus précise qui puisse être utilisée plus facilement . Je propose également les règles suivantes:
- Un post par jeu de données
- Aucun lien vers le jeu de données
chaque ensemble de données doit être associé à
un nom (pour comprendre de quoi il s'agit) et un lien vers le jeu de données (les jeux de données R peuvent être nommés avec le nom du paquet)
le nombre d'entités (disons que c'est p ) la taille de l'ensemble de données (disons que c'est n ) et le nombre d'étiquettes / classe (disons que c'est k )
un taux d'erreur typique de votre expérience (indiquez l'algorithme utilisé en mots) ou de la littérature (dans ce dernier cas, reliez le document)