La classification des images consiste à attribuer l'un desétiquettes précédemment connues pour une image donnée. Par exemple, vous savez que vous recevrez quelques photos et chaque image a exactement l'une desen elle. L'algorithme devrait dire ce que la photo montre.
L'ensemble de données de référence pour la classification des images est ImageNet ; surtout ton défi de reconnaissance visuelle à grande échelle (LSVRC) . Il a exactement 1000 classes et une énorme quantité de données d'entraînement (je pense qu'il existe une version sous-échantillonnée avec environ 250 images x 250 pixels, mais de nombreuses images semblent provenir de Flicker).
Ce défi est généralement résolu avec les CNN (ou d'autres réseaux de neurones).
Existe-t-il un article qui tente une approche qui n'utilise pas les réseaux de neurones dans LSVRC?
Pour clarifier la question: bien sûr, il existe d'autres algorithmes de classification comme voisins les plus proches ou SVM. Cependant, je doute qu'ils fonctionnent du tout pour autant de classes / autant de données. Au moins pour-NNs je suis sûr que la prédiction serait extrêmement lente; pour les SVM, je suppose que l'ajustement et la prédiction seraient beaucoup trop lents (?).