Un détecteur de point d'intérêt (point clé, point saillant) est un algorithme qui choisit des points dans une image en fonction d'un critère. En règle générale, un point d'intérêt est un maximum local d'une fonction, telle qu'une métrique de "cornerness".
Un descripteur est un vecteur de valeurs, qui décrit en quelque sorte le patch d'image autour d'un point d'intérêt. Cela pourrait être aussi simple que les valeurs brutes des pixels, ou cela pourrait être plus compliqué, comme un histogramme des orientations de gradient.
Ensemble, un point d'intérêt et son descripteur sont généralement appelés une caractéristique locale. Les fonctionnalités locales sont utilisées pour de nombreuses tâches de vision par ordinateur, telles que l'enregistrement d'images, la reconstruction 3D, la détection d'objets et la reconnaissance d'objets.
Harris, Min Eigen et FAST sont des détecteurs de points d'intérêt, ou plus précisément des détecteurs de coin.
SIFT comprend à la fois un détecteur et un descripteur. Le détecteur est basé sur la différence des Gaussiens (DoG), qui est une approximation du Laplacien. Le détecteur DoG détecte les centres de structures en forme de goutte. Le descripteur SIFT est basé sur un histogramme des orientations de gradient.
SURF est censé être une approximation rapide de SIFT.
BRISK, comme SIFT et SURF, comprend un détecteur et un descripteur. Le détecteur est un détecteur de coin. Le descripteur est une chaîne binaire représentant les signes de la différence entre certaines paires de pixels autour du point d'intérêt.