Détection d'objets versus reconnaissance d'objets


8

J'ai une légère confusion qui différencie la reconnaissance d'objets et la détection d'objets. Certaines personnes disent que la détection d'objets est un sous-thème de la reconnaissance d'objets? Quelqu'un peut-il clarifier la différence entre ces deux sujets?

Au mieux de ma connaissance:

La reconnaissance d'objets répond à la question "Quel est l'objet dans l'image" alors que la détection d'objets répond à la question "Où est cet objet"?

J'espère que quelqu'un pourra illustrer la différence en fournissant également généreusement un exemple pour chacun.


Cette réponse peut vous aider: stackoverflow.com/a/34691321/1546088
acgtyrant

Réponses:


11

Vous avez en quelque sorte répondu à votre propre question.

Reconnaissance d'objets: quel objet est représenté sur l'image?

  • entrée : une image contenant des objets inconnus

    Il est possible que la position de l'objet puisse être marquée dans l'entrée ou que l'entrée ne soit qu'une image claire de l'objet (non occlus).

  • sortie : position (s) et étiquette (s) (noms) des objets dans l'image

    Les positions des objets sont soit acquises à partir de l'entrée, soit déterminées sur la base de l'image d'entrée.

    Lors de l'étiquetage des objets, il existe généralement un ensemble de catégories / étiquettes que le système "connaît" et entre lesquelles le système peut se différencier (par exemple, un chien, une voiture, un cheval, une vache ou un oiseau).

Détection d'objets: où est cet objet dans l'image?

  • entrée: une image claire d'un objet, ou une sorte de modèle d'un objet (par exemple canard) et une image (éventuellement) contenant l'objet d'intérêt

  • sortie: position, ou un cadre de délimitation de l'objet d'entrée s'il existe dans l'image (par exemple, le canard est dans le coin supérieur gauche de l'image)


0

Base de détection d'objets sur le point d'intérêt d'une image donnée; par exemple, l'oiseau en image et la reconnaissance ont parlé des informations spécifiques sur l'oiseau, comme le nom, le type et d'autres caractéristiques d'un point d'intérêt particulier.


Pouvez-vous développer un peu cette réponse, car la façon dont elle aborde la question n'est pas exactement claire. C'est du moins ma perception.
A_A

Reconnaissance d'objets: dans une image donnée, vous devez détecter tous les objets (une classe restreinte d'objets dépend de votre ensemble de données), les localiser avec un cadre de sélection et étiqueter ce cadre de sélection avec une étiquette. Reconnaissance d'objets. Détection d'objets: c'est comme la reconnaissance d'objets, mais dans cette tâche, vous n'avez que deux classes de classification d'objets, ce qui signifie des zones de délimitation d'objet et des zones de délimitation sans objet. Par exemple, Détection de voiture: vous devez détecter toutes les voitures dans une image donnée avec leurs boîtes englobantes
user35925

La reconnaissance d'objets répond à la question "Quel est l'objet dans l'image" alors que la détection d'objets répond à la question "Où est cet objet". Problème de récupération d'image, c'est-à-dire le problème de la recherche d'images numériques dans de grandes bases de données.
user35925

Merci mais je ne vous demandais pas personnellement. La réponse est apparue dans ma file d'attente et j'ai pensé qu'il valait la peine de l'étendre un peu plus que ce que vous auriez pu laisser en commentaire. Un message de réponse est généralement un peu plus élaboré. Bonne chance.
A_A

0

tard, mais voici la réponse. source: https://www.learnopencv.com/selective-search-for-object-detection-cpp-python/

Un algorithme de reconnaissance d'objets identifie les objets présents dans une image. Il prend l'image entière comme entrée et génère des étiquettes de classe et des probabilités de classe d'objets présents dans cette image. Par exemple, une étiquette de classe pourrait être «chien» et la probabilité de classe associée pourrait être de 97%.

D'un autre côté, un algorithme de détection d'objet vous indique non seulement quels objets sont présents dans l'image, mais génère également des cadres de délimitation (x, y, largeur, hauteur) pour indiquer l'emplacement des objets à l'intérieur de l'image

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.