Je suis novice en apprentissage automatique et en kéros et je travaille actuellement sur un problème de classification d'images multi-classes en utilisant des kéros. L'entrée est l'image balisée. Après un certain prétraitement, les données d'entraînement sont représentées dans la liste Python comme:
[["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]]
«chien», «chat» et «oiseau» sont les étiquettes de classe. Je pense que l'encodage à chaud devrait être utilisé pour ce problème, mais je ne suis pas très clair sur la façon de le traiter avec ces étiquettes de chaîne. J'ai essayé LabelEncoder () de sklearn de cette manière:
encoder = LabelEncoder()
trafomed_label = encoder.fit_transform(["dog", "cat", "bird"])
print(trafomed_label)
Et la sortie est [2 1 0], ce qui est différent de ma sortie attendue de quelque chose comme [[1,0,0], [0,1,0], [0,0,1]]. Cela peut être fait avec du codage, mais j'aimerais savoir s'il existe une manière "standard" ou "traditionnelle" de le gérer?