Dans quelle mesure serait-il viable de classer la texture d'une image à l'aide des caractéristiques d'une transformée en cosinus discrète? Googler "texture classification dct" ne trouve qu'un seul article académique sur ce sujet, en utilisant un réseau de neurones.
Pour mon application, j'ai un grand corpus d'images étiquetées, dans lequel l'image entière est une texture cohérente (par exemple des plans rapprochés d'une couverture, d'écorce d'arbre, d'un champ herbeux, etc.).
Inspiré par une réponse à une question précédente , j'envisageais l'approche suivante:
- diviser chaque image en NxN blocs de pixels
- prendre le DCT de chaque bloc
- aplatissez chaque DCT dans une baie 1xM et alimentez-le en un algorithme de clustering K-Means, et obtenez l'étiquette de cluster pour chaque DCT
- calculer un histogramme d'étiquettes de regroupement pour chaque image en comptant chaque étiquette par image à partir de # 3
- former un classificateur SVM en lui fournissant un ensemble de [(histogramme, étiquette d'image)]
Dans quelle mesure cela fonctionnerait-il? J'ai implémenté un système similaire, en utilisant des fonctionnalités extraites via les algorithmes SIFT / SURF, mais je n'ai pu obtenir qu'une précision d'environ 60%.
De quelles autres manières pourrais-je utiliser le DCT pour classer les textures?