Je ne sais pas si vous voulez simplement faire correspondre deux images (par exemple trouver les points communs), ou si vous voulez essayer quelque chose comme CBIR (récupération d'image basée sur le contenu - recherche dans une base de données avec une image modèle pour trouver tout ce qui contient le objet).
Je fais actuellement des recherches CBIR, donc je suis assez à jour avec les méthodes actuelles. Voici et voici les liens vers mes réponses à des problèmes similaires au vôtre de stackoverflow, vous devriez jeter un oeil.
Maintenant, pour parler un peu de SIFT. Lorsque if a été introduit pour la première fois par Lowe, le terme SIFT s'appliquait à la fois au processus de détection des entités et aux descripteurs d'entités calculés sur ces points d'intérêt détectés. Jusqu'à ce jour, les descripteurs SIFT se sont révélés incroyablement impressionnants. Les descripteurs ont des propriétés intéressantes que @Totero a déjà mentionnées.
En revanche, la méthode de détection SIFT , de plus en plus souvent appelée DoG (Différence des Gaussiens), n'est plus à la pointe de la technologie. Il est encore largement utilisé, mais pour le processus de détection de fonctionnalités, il existe aujourd'hui plus de méthodes, dont certaines sont meilleures ou complètent bien les types d'extraits de processus DoG invariants.
La plupart des articles actuels (regardez les liens dans les questions liées au stackoverflow) ont une autre pratique intéressante: ils combinent plusieurs façons de détecter des entités, puis utilisent des descripteurs SIFT (qui restent toujours des descripteurs) pour calculer les représentations vectorielles invariantes. Je travaille actuellement avec une combinaison de DoG (ils se concentrent sur les parties d'images en coin) et de régions MSER (ils se concentrent sur les points distinctifs de type blob à travers plusieurs échelles). Vous voudrez peut-être essayer et expérimenter et y lancer encore plus de types de détecteurs de fonctionnalités, si vous trouvez que cette combinaison n'est pas satisfaisante sur votre base de données d'images particulière.
De plus, si vous êtes intéressé, voici un article qui évalue les performances de différentes combinaisons de détection et de descripteurs. Je ne l'ai pas lu depuis DoG & MSER + SIFT fonctionne bien pour moi, mais je l'ai parcouru et le papier est assez bon.
PS: utilisez google scholar si vous n'avez pas accès à la base de données IEEEXplore à laquelle je suis lié.