J'ai lu beaucoup d'articles sur la détection d'objets, la reconnaissance d'objets, la segmentation d'objets, la segmentation d'images et la segmentation d'images sémantique et voici mes conclusions qui pourraient ne pas être vraies:
Reconnaissance d'objets: dans une image donnée, vous devez détecter tous les objets (une classe restreinte d'objets dépend de votre jeu de données), les localiser avec un cadre de sélection et étiqueter ce cadre de sélection avec une étiquette. Dans l'image ci-dessous, vous verrez une sortie simple d'une reconnaissance d'objet de pointe.
Détection d'objets: c'est comme la reconnaissance d'objets, mais dans cette tâche, vous n'avez que deux classes de classification d'objets, ce qui signifie des zones de délimitation d'objet et des zones de délimitation sans objet. Par exemple Détection de voiture: vous devez Détecter toutes les voitures dans une image donnée avec leurs boîtes englobantes.
Segmentation des objets: comme la reconnaissance d'objets, vous reconnaîtrez tous les objets d'une image, mais votre sortie devrait montrer cet objet classant les pixels de l'image.
Segmentation de l'image: dans la segmentation de l'image, vous segmenterez les régions de l'image. votre sortie ne marquera pas les segments et la région d'une image qui doivent être cohérents les uns avec les autres dans le même segment. L'extraction de super pixels d'une image est un exemple de cette tâche ou de la segmentation de premier plan-arrière-plan.
Segmentation sémantique: Dans la segmentation sémantique, vous devez étiqueter chaque pixel avec une classe d'objets (voiture, personne, chien, ...) et non-objets (eau, ciel, route, ...). En d'autres termes, dans la segmentation sémantique, vous étiqueterez chaque région de l'image.