J'ai été envoyé ici à partir de cette question dans stackoverflow , veuillez m'excuser si la question vient trop spécifique et ce n'est pas dans les manières ici :)
La tâche consiste à trouver un verre contenant un liquide spécifique. Permettez-moi de vous montrer les images, puis de décrire ce que j'essaie de réaliser et comment j'essayais de le faire jusqu'à présent dans la description ci-dessous les images.
Les images : (il semble que j'ai besoin d'au moins 10 points de réputation pour publier des images et des liens, donc les liens devront faire :( sinon vous pouvez regarder la question de débordement de pile)
Une description détaillée : J'essayais d'implémenter un algorithme qui détecterait un verre d'une forme spécifique en opencv (le verre peut être transformé par un angle / distance de prise de vue différent). Il y aura également d'autres verres d'autres formes. Le verre que je recherche sera également rempli d'un liquide coloré qui le distinguera des verres contenant d'autres couleurs.
Jusqu'à présent, j'ai essayé d'utiliser l'extracteur de fonctionnalités SIFT pour essayer de trouver certaines fonctionnalités dans la vitre, puis les faire correspondre avec d'autres photos avec la vitre.
Cette approche ne fonctionnait que dans des conditions très spécifiques où j'aurais du verre dans une position très spécifique et le fond serait similaire aux images d'apprentissage. Le problème est également que le verre est un objet 3D et je ne sais pas comment en extraire des caractéristiques (peut-être plusieurs photos sous différents angles liés en quelque sorte?).
Maintenant, je ne sais pas quelle autre approche puis-je utiliser. J'ai trouvé quelques indices à ce sujet (ici /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ) mais les liens semblent rompus.
Un autre problème serait de détecter différents "niveaux de vide" dans un tel verre, mais je n'ai même pas pu trouver le verre lui-même correctement.
Quelles seraient vos recommandations sur l'approche dans cette tâche? Serait-il préférable d'utiliser une manière différente de trouver la fonction d'objet 3D locale? Ou serait-il préférable d'utiliser une autre approche tout à fait? J'ai entendu parler d'algorithmes "apprenant" l'objet à partir d'un ensemble de plusieurs photos mais je n'ai jamais vu cela en pratique.
Tout conseil serait vraiment apprécié